濮阳杆衣贸易有限公司

主頁 > 知識庫 > pandas分組排序 如何獲取第二大的數(shù)據(jù)

pandas分組排序 如何獲取第二大的數(shù)據(jù)

熱門標簽:400電話申請服務商選什么 平頂山外呼系統(tǒng)免費 清遠360地圖標注方法 在哪里辦理400電話號碼 工廠智能電話機器人 千陽自動外呼系統(tǒng) 原裝電話機器人 江蘇客服外呼系統(tǒng)廠家 西藏智能外呼系統(tǒng)五星服務

Python用來做數(shù)據(jù)分析很方便,網(wǎng)上很多關于找數(shù)據(jù)中第二大的方法,但是大多數(shù)都是關于SQL的,于是我挑戰(zhàn)一下用Python來做這件事(主要是SQL寫的不好>_),上代碼。

1、數(shù)據(jù)我是自己編的

在實際工作中應該從數(shù)據(jù)庫中導入數(shù)據(jù),如何從數(shù)據(jù)庫導出數(shù)據(jù),我之后會補充。

import pandas as pd
df = pd.DataFrame([
    {"class": 1, "name": "aa", "english": 120},
    {"class": 1, "name": "bb", "english": 110},
    {"class": 1, "name": "cc", "english": 110},
    {"class": 1, "name": "dd", "english": 110},
    {"class": 2, "name": "ee", "english": 120},
    {"class": 2, "name": "ff", "english": 140},
    {"class": 2, "name": "gg", "english": 130},
    {"class": 2, "name": "hh", "english": 130},
    {"class": 3, "name": "tt", "english": 130},
    {"class": 4, "name": "xx", "english": 130},
    {"class": 4, "name": "yy", "english": 130},
    {"class": 5, "name": "zz", "english": None},
  ])

2、分組取第二大的數(shù)據(jù)

def fun(df):
  # english數(shù)據(jù)去重
  sort_set = set(df["english"].values.tolist())
  if len(sort_set)=1:
    # 數(shù)據(jù)量小于等于1,無法取到第二大的數(shù)據(jù)
    return None
  else:
    # 取english中第二大的值
    sort_value = sorted(sort_set,reverse=True)[1]
    temp_df = df[df["english"]==sort_value]
    return temp_df
 
df = df.groupby(by=["class"]).apply(fun).reset_index(drop=True)
print(df)

結果如下:

  class name english
0 1 bb 110.0
1 1 cc 110.0
2 1 dd 110.0
3 2 gg 130.0
4 2 hh 130.0

3、寫完啦,就這么簡單

當然這還可以改為取最大、取最小、取第三大、等等......

補充:pandas 按某一列A排序,按B和C兩列分組,選擇分組后A列值最大的行

pandas 按某一列A排序,按B和C兩列分組,選擇分組后A列值最大的行

一、需求

按 updateTime 列倒序排序,按 B 和 C 兩列分組,分組后選擇最后更新的時間的那一行,并將結果加上新索引。

二、代碼

import pandas as pd
data = pd.read_csv('test.csv')
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['B','C']).first().reset_index()

first() 函數(shù)代表選擇第一行,如果要選取多行,可以使用 head() 函數(shù): head(5)表示選擇前五行。

如下例:

import pandas as pd 
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data) 
# 按日期分組,分組后對 value 列從大到小排序,取每組前十行
df = df.groupby('date', group_keys=False).apply(lambda x: x.sort_values('value', ascending=False)).groupby('date').head(10).reset_index()

在不能直接使用sort_values() 函數(shù)時,使用 apply() 函數(shù)。

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • Pandas中DataFrame的分組/分割/合并的實現(xiàn)
  • pandas 實現(xiàn)分組后取第N行
  • pandas group分組與agg聚合的實例
  • pandas groupby分組對象的組內排序解決方案
  • pandas組內排序,并在每個分組內按序打上序號的操作
  • pandas 實現(xiàn)某一列分組,其他列合并成list

標簽:錦州 西安 天水 安慶 日照 股票 白城 隨州

巨人網(wǎng)絡通訊聲明:本文標題《pandas分組排序 如何獲取第二大的數(shù)據(jù)》,本文關鍵詞  pandas,分組,排序,如何,獲取,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas分組排序 如何獲取第二大的數(shù)據(jù)》相關的同類信息!
  • 本頁收集關于pandas分組排序 如何獲取第二大的數(shù)據(jù)的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    北碚区| 博湖县| 共和县| 独山县| 延津县| 盐源县| 如东县| 克东县| 密云县| 黑龙江省| 泽州县| 三穗县| 乌兰浩特市| 永川市| 武邑县| 封丘县| 子长县| 阿拉尔市| 赤壁市| 南汇区| 连江县| 田林县| 安阳县| 固镇县| 垣曲县| 乐山市| 砀山县| 肥城市| 三穗县| 涡阳县| 万盛区| 石棉县| 潼南县| 曲周县| 梁河县| 焦作市| 黎城县| 新乡县| 景洪市| 班玛县| 济南市|