pandas讀取Excel
import pandas as pd
# 參數(shù)1:文件路徑,參數(shù)2:sheet名
pf = pd.read_excel(path, sheet_name='sheet1')
刪除指定列
# 通過列名刪除指定列
pf.drop(['序號(hào)', '替代', '簽名'], axis=1, inplace=True)
替換列名
# 舊列名 新列名對(duì)照
columns_map = {
'列名1': 'newname_1',
'列名2': 'newname_2',
'列名3': 'newname_3',
'列名4': 'newname_4',
'列名5': 'newname_5',
# 沒有列名的情況
'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
替換 Nan
通常使用
替換表格中的空值,(Nan)。
但是,你可能會(huì)發(fā)現(xiàn) fillna() 會(huì)有不好使的時(shí)候,記得加上 inplace=True
# 加上 inplace=True 表示修改原對(duì)象
pf.fillna('新值', inplace=True)
官方對(duì) inplace 的解釋
inplace : boolean, default False
If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).
全列輸出不隱藏
你可能會(huì)發(fā)現(xiàn),輸出表格的時(shí)候會(huì)出現(xiàn)隱藏中間列的情況,只輸出首列和尾列,中間用 … 替代。
加上下面的這句話,再打印的話,就會(huì)全列打印。
pd.set_option('display.max_columns', None)
print(pf)
將Excel轉(zhuǎn)換為字典
pf_dict = pf.to_dict(orient='records')
全部代碼
import pandas as pd
pf = pd.read_excel(path, sheet_name='sheet1')
columns_map = {
'列名1': 'newname_1',
'列名2': 'newname_2',
'列名3': 'newname_3',
'列名4': 'newname_4',
'列名5': 'newname_5',
# 沒有列名的情況
'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.drop(['序號(hào)', '替代', '簽名'], axis=1, inplace=True)
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
pf.fillna('Unknown', inplace=True)
# pd.set_option('display.max_columns', None)
# print(smt)
pf_dict = pf.to_dict(orient='records')
補(bǔ)充:python pandas replace 0替換成nan,bfill/ffill
0替換成nan
一般情況下,0 替換成nan會(huì)寫成
df.replace(0, None, inplace=True)
然而替換不了,應(yīng)該是這樣的
df.replace(0, np.nan, inplace=True)
nan替換成前值后值
df.ffill(axis=0) # 用前一個(gè)值替換
df.bfill(axis=0) # 用后一個(gè)值替換
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- 教你使用Pandas直接核算Excel中的快遞費(fèi)用
- Python入門之使用pandas分析excel數(shù)據(jù)
- pandas讀取excel時(shí)獲取讀取進(jìn)度的實(shí)現(xiàn)
- pandas讀取excel,txt,csv,pkl文件等命令的操作
- python pandas模糊匹配 讀取Excel后 獲取指定指標(biāo)的操作
- pandas針對(duì)excel處理的實(shí)現(xiàn)
- 關(guān)于Python 解決Python3.9 pandas.read_excel(‘xxx.xlsx‘)報(bào)錯(cuò)的問題
- 解決使用Pandas 讀取超過65536行的Excel文件問題
- 利用Python pandas對(duì)Excel進(jìn)行合并的方法示例
- Python pandas對(duì)excel的操作實(shí)現(xiàn)示例
- pandas to_excel 添加顏色操作
- 解決python pandas讀取excel中多個(gè)不同sheet表格存在的問題
- Python pandas如何向excel添加數(shù)據(jù)
- pandas中的ExcelWriter和ExcelFile的實(shí)現(xiàn)方法
- pandas實(shí)現(xiàn)excel中的數(shù)據(jù)透視表和Vlookup函數(shù)功能代碼
- Python使用Pandas讀寫Excel實(shí)例解析
- pandas將多個(gè)dataframe以多個(gè)sheet的形式保存到一個(gè)excel文件中
- 利用python Pandas實(shí)現(xiàn)批量拆分Excel與合并Excel