您的位置:首頁技術文章
文章詳情頁

Python處理excel根據全稱自動填寫簡稱

瀏覽:3日期:2022-06-25 14:20:29

在工作中處理excel遇到需要根據器件生產供應商全稱填寫簡稱的一列,由于數據表格中器件數多達幾萬條,單純靠excel篩選功能手動處理需要耗費大量時間,這里使用Python中的pandas模塊,讀取excel進行處理。

1、需求

根據存儲有供應商全稱簡稱對應的表格對應關系.xlsx,自動填寫帶有供應商全稱的表格待處理文件.xlsx中簡稱的一列。

Python處理excel根據全稱自動填寫簡稱

Python處理excel根據全稱自動填寫簡稱

2.腳本思路

首先使用pandas讀取第一個表格對應關系.xlsx,然后將其儲存在一個字典中,字典的鍵為供應商的全稱,字典的值為供應商的簡稱。

然后讀取第二個表格待處理文件.xlsx,根據列的標題頭,找到供應商全稱所處在的列,根據這一列每一個供應商的全稱查詢字典中對應鍵的值,將其寫入表格中對應行的簡稱處。(這里暫時假設對應關系和待處理文件中供應商的全稱如果是同一家公司則公司全稱是一模一樣的,存在些許差別的處理的方法在下一篇文章中在記錄)。

3.代碼

# -*- coding: utf-8 -*-'''Created on Thu Mar 4 21:25:05 2021@author: ruofei''' import pandas as pd #填寫待處理文件和對應關系的excel文件路徑#注意:腳本運行時需保證被使用excel文件處于關閉狀態file1 = r’待處理文件.xlsx’file2 = r’對應關系.xlsx’ #填寫待處理文件中 全稱所在的列名和簡稱要放置的列名qc1='供應商'jc1='簡稱' #填寫對應關系中 全稱所在的列數和簡稱所在的列數qc2='全稱'jc2='簡稱' #填寫讀取excel文件的sheet表名sheet1='Sheet1'sheet2='Sheet1' #--------------------*-------------*--------------*---------------------#--------------------*-------------*--------------*---------------------data1 = pd.read_excel(file1, sheet_name = sheet1)data2 = pd.read_excel(file2, sheet_name = sheet2) #print('輸出表格所有')#print(data1) row1 = data1.shape[0]#行數col1=data1.shape[1]#列數 row2 = data2.shape[0]#行數col2=data2.shape[1]# #print('表格文件有'+str(row1)+'行,'+str(col1)+'列') duiying=dict() #生成對應關系的字典for i in range(row2): quancheng=data2.loc[i,qc2] jiancheng=data2.loc[i,jc2] duiying[quancheng]=jiancheng #print(quancheng) #company1=data1.loc[0][0]#company2=data1.loc[1][0]#print('公司一為'+str(company1)+'n'+'公司二為'+str(company2)) for i in range(row1): a=data1.loc[i,qc1] #[qc1-1] #print(str(a)) jiancheng=duiying.get(a) if a in duiying.keys(): #print(jiancheng) data1.loc[i,jc1]=jiancheng else: #此處修改沒有簡稱賦予值,若賦予全稱值則=a,若為空則=' ' data1.loc[i,jc1]=a data1.to_excel(’處理好的文件.xlsx’,sheet_name=’Sheet1’)

4.實現功能

根據預先整理好的對應關系表格自動填寫了表格中簡稱空白的一列,如果表格中存在對應關系中不存在的公司,則在相應的簡稱位置填寫其全稱本身。如下圖中,由于表中的小米華為沒有給出其簡稱,因此原樣照填。

Python處理excel根據全稱自動填寫簡稱

5.存在問題

在實際應用中處理幾萬條數據時,絕大部分正常,存在問題是,比如對應關系中全稱為(中國)茅臺公司,而在要處理的文件中不存在括號,或者括號中英文不同,或者括號中空格數不同,都會在后面讀取為不同的字符串,在查詢字典中顯示不存在。處理方式在下篇中解決。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: python
相關文章:
国产综合久久一区二区三区