目錄
- 1.按照一列數(shù)值進行排序
- 1.1按照五缺失值的一列進行排序
- 1.2按照有缺失值的一列進行排序
- 1.2.1 缺失值顯示在最后
- 1.2.2 缺失值顯示在最前面
- 2.按照多列數(shù)值進行排序
本文用到的表格內(nèi)容如下:
排序前先來看一下原始情形:
import pandas as pd
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df)
result:
姓名 年齡 成績
0 小明 23.0 78
1 小剛 NaN 89
2 小紅 876.0 65
3 李華 65.0 89
4 小美 NaN 43
5 張三 34.0 90
6 李四 NaN 34
7 王五 98.5 87
1.按照一列數(shù)值進行排序
按照某一列數(shù)值進行排序就是整個數(shù)據(jù)表都要以某一列為準,進行升序或降序
排序需要用到sort_values()方法,在sort_values()方法中要通過by參數(shù)指明要排序的列名,通過ascending參數(shù)知名升序還是降序。
1.1按照五缺失值的一列進行排序
1.1.1升序排列
該方法默認升序排列(即ascending參數(shù)的默認值是True),使用by參數(shù)用來指定需要排序的列名
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"]))
result:
姓名 年齡 成績
6 李四 NaN 34
4 小美 NaN 43
2 小紅 876.0 65
0 小明 23.0 78
7 王五 98.5 87
1 小剛 NaN 89
3 李華 65.0 89
5 張三 34.0 90
1.1.2 降序排列
只要設(shè)置ascending參數(shù)的值為False,即可實現(xiàn)降序排列
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"], ascending=False))
result:
姓名 年齡 成績
5 張三 34.0 90
1 小剛 NaN 89
3 李華 65.0 89
7 王五 98.5 87
0 小明 23.0 78
2 小紅 876.0 65
4 小美 NaN 43
6 李四 NaN 34
1.2按照有缺失值的一列進行排序
當待排序的列中有缺失值時,可以通過設(shè)置na_position參數(shù)對缺失值的顯示位置進行設(shè)置
1.2.1 缺失值顯示在最后
該方法默認缺失值顯示在最后(na_position參數(shù)的默認值是last)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"]))
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["年齡"]))
result:
姓名 年齡 成績
0 小明 23.0 78
5 張三 34.0 90
3 李華 65.0 89
7 王五 98.5 87
2 小紅 876.0 65
1 小剛 NaN 89
4 小美 NaN 43
6 李四 NaN 34
1.2.2 缺失值顯示在最前面
只要設(shè)置na_position參數(shù)的值為first,即可實現(xiàn)缺失值顯示在最前面
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["年齡"], na_position='first'))
result:
姓名 年齡 成績
1 小剛 NaN 89
4 小美 NaN 43
6 李四 NaN 34
0 小明 23.0 78
5 張三 34.0 90
3 李華 65.0 89
7 王五 98.5 87
2 小紅 876.0 65
2.按照多列數(shù)值進行排序
按照多列數(shù)值排序是指同時依據(jù)多列數(shù)據(jù)進行升序、降序排列。當?shù)谝涣谐霈F(xiàn)重復(fù)值時按照第二列進行排序,第二列出現(xiàn)重復(fù)值時按照第三列進行排序,依次類推。
此時在sort_values()方法中需要排序的多個列名要以列表的形式傳遞給by參數(shù),需要每個排序的列名所對應(yīng)的排序方式也要以列表的形式傳遞給ascending參數(shù),二者的列表要一一對應(yīng)。
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績", "年齡"], ascending=[True, False]))
result:
姓名 年齡 成績
6 李四 NaN 34
4 小美 NaN 43
2 小紅 876.0 65
0 小明 23.0 78
7 王五 98.5 87
3 李華 65.0 89
1 小剛 NaN 89
5 張三 34.0 90
此時按照成績進行升序排列,當成績相同時再按照年齡進行降序排列。
到此這篇關(guān)于pandas數(shù)值排序的實現(xiàn)實例的文章就介紹到這了,更多相關(guān)pandas數(shù)值排序內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!