文章詳情頁

使用Python構造hive insert語句說明

瀏覽：25日期：2022-07-22 14:33:26

mysql可以使用nevicat導出insert語句用于數據構造，但是hive無法直接導出insert語句。我們可以先打印在hive命令行，然后使用腳本拼裝成insert語句，進行數據構造。

使用Python構造hive insert語句說明

手動copy到python腳本進行sql語句構造：

def transformString(s): list_s = s.split(’t’) print(len(list_s)) s_new = ’’ for item in list_s: s_new += ’'’ + item.strip(’ ’) + ’'’ + ’,’ return str(s_new.rstrip(’,’))# 為手動copy hive命令行打印輸出的記錄s = '555 helloworld's_new = transformString(s)sql = ’insert into dw.test PARTITION (ymd = ’2019-03-18’) values({});’.format(s_new)print(sql)

結果：

insert into dw.test PARTITION (ymd = ’2019-03-18’) values('555','helloworld');

補充知識：python向hive插入數據遇到的坑

因項目需求，應用python建模需要通過hive取數，并將結果寫入hive表。

嘗試了以下幾條坑爹路，僅做記錄如下：

通過impyla庫搭建hive與python橋梁

1.1 環境配置的坑（回頭放連接）

注: 遠程訪問hive一定要記得配置賬號密碼?。?！報錯：。。。-4.。。

1.2 一定不要用impyla中的executemany去批量插入數據，也不要用其他的方式向hive插入數據，都是坑！奇慢無比！找資料也都是說不建議這么做。

長途跋涉hdfs法

2.1 先用python的pyhdfs庫將結果寫成hdfs文件，然后。。。尼瑪??！根本沒成功連上服務器的hdfs，本地hdfs到是可以的

2.2 那既然寫hdfs，我就直接將模型結果通過hadoop/hdfs命令上傳至hdfs。然后，通過hive命令load data將hdfs中的結果再導入hive。雖然有點繞，但是成功了?。?！BUT?。。⌒⌒值?，這個直接操作HDFS風險太高了，要不你還是另尋他法吧，不可以拒絕哦?。?！

2.3 好吧，根據建議，使用kafka，抱歉這個坑后面再來踩。

2.4 臨時處理方案：先將結果寫入mysql，再轉入hive，這個沒有坑，具體我也只是寫到mysql，無坑。。就是有點繞。。。

以上這篇使用Python構造hive insert語句說明就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持好吧啦網。

Python 編程

上一條：在python中使用pyspark讀寫Hive數據操作下一條：Python通過kerberos安全認證操作kafka方式

相關文章：

1. HTML中的XML數據島記錄編輯與添加2. 三個不常見的 HTML5 實用新特性簡介3. 淺談CSS不規則邊框的生成方案4. html中的form不提交（排除）某些input 原創5. asp在iis7報錯行號不準問題的解決方法6. msxml3.dll 錯誤 800c0019 系統錯誤:-2146697191解決方法7. CSS可以做的幾個令你嘆為觀止的實例分享8. 詳解盒子端CSS動畫性能提升9. CSS linear-gradient屬性案例詳解10. CSS百分比padding制作圖片自適應布局

排行榜

					
					PHP連接MySQL數據庫操作代碼實例解析
詳解Python中openpyxl模塊基本用法
Vue中父子組件的值傳遞與方法傳遞
python和opencv構建運動檢測器的實現
深度源碼解析Java 線程池的實現原理
JSR 196:pluggable authentication for JEE containers 草案發布
每日六道java新手入門面試題,通往自由的道路--JVM
vue路由切換時取消之前的所有請求操作
asp在iis7報錯行號不準問題的解決方法
Vue實現div滾輪放大縮小
Python中return函數返回值實例用法
				

熱門標簽

国产综合久久一区二区三区