前言
Python是一門實(shí)現(xiàn)數(shù)據(jù)可視化很好的語言,他們里面的很多庫可以很好的畫出圖形,形象明了。
今天我們就來說說:Pandas數(shù)據(jù)分析核心支持庫
初識(shí)Pandas:
Pandas 是 Python 語言的一個(gè)擴(kuò)展程序庫,用于數(shù)據(jù)分析。
Pandas 是一個(gè)開放源碼、BSD 許可的庫,提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。
Pandas 名字衍生自術(shù)語 “panel data”(面板數(shù)據(jù))和 “Python data analysis”(Python 數(shù)據(jù)分析)。
Pandas 一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基礎(chǔ)是 Numpy(提供高性能的矩陣運(yùn)算),其次數(shù)series,還有一個(gè)DataFrame,這三個(gè)比較常用。
Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導(dǎo)入數(shù)據(jù)。
Pandas 可以對(duì)各種數(shù)據(jù)進(jìn)行運(yùn)算操作,比如歸并、再成形、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征。
Pandas 廣泛應(yīng)用在學(xué)術(shù)、金融、統(tǒng)計(jì)學(xué)等各個(gè)數(shù)據(jù)分析領(lǐng)域。
Pandas的主體:
Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì)、社會(huì)科學(xué)、工程等領(lǐng)域里的大多數(shù)典型用例。
Series:帶標(biāo)簽的一維同構(gòu)數(shù)組,一種類似于一維數(shù)組的對(duì)象,它由一組數(shù)據(jù)(各種Numpy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。
DataFrame:帶標(biāo)簽,大小可變,二維異構(gòu)表格。一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。
Pandas的安裝:
終端輸入,如果你跟我一樣使用Anaconda中的Jupyter進(jìn)行代表編寫的話,也可以在Anaconda的終端里輸入,之后就可以直接用了,他是Python中的一個(gè)庫,使用不需要安裝什么其他軟件,擁有Python編譯器即可。
Pandas的應(yīng)用:
1:導(dǎo)入pandas庫
2:pandas之series
Pandas Series 類似表格中等一個(gè)列(column),類似于一維數(shù)組,可以保存任何數(shù)據(jù)類型 Series 由索引(index)和列組成,函數(shù)如下:
pandas.Series( data, index, dtype, name, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray 類型)。
index:數(shù)據(jù)索引標(biāo)簽,如果不指定,默認(rèn)從 0 開始。
dtype:數(shù)據(jù)類型,默認(rèn)會(huì)自己判斷。
name:設(shè)置名稱。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
FIrst:
import pandas as pd
a = ["shimmer", "zhuzhu", "recently祝祝"]
myvar = pd.Series(a)
print(myvar)
代碼結(jié)果:
Second:可修改索引值、
Third:使用字典創(chuàng)建, key/value 對(duì)象,類似字典來創(chuàng)建 Series
Fourth:可以通過索引值的指定來取值
3:pandas之Dataframe
DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個(gè)索引)。
DataFrame 構(gòu)造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray、series, map, lists, dict 等類型)。
index:索引值,或者可以稱為行標(biāo)簽。
columns:列標(biāo)簽,默認(rèn)為 RangeIndex (0, 1, 2, …, n) 。
dtype:數(shù)據(jù)類型。
copy:拷貝數(shù)據(jù),默認(rèn)為 False。
Demo:
First:指定列標(biāo)
Second:列分開插入,通過字典的形式創(chuàng)建
Third:使用字典(key/value),其中字典的 key 為列名:
fourth:通過loc取值,類似于列表里x,index【number】取值
Fifth:可以返回多行數(shù)據(jù),使用 [[ … ]] 格式,… 為各行的索引,以逗號(hào)隔開:
Sixth:指定索引值
Seventh:取指定索引值
本篇就到這吧,希望看完這篇文章對(duì)你有用。
總結(jié)
到此這篇關(guān)于python學(xué)習(xí)之panda數(shù)據(jù)分析核心支持庫的文章就介紹到這了,更多相關(guān)python之panda模塊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python數(shù)據(jù)分析之繪圖和可視化詳解
- Python數(shù)據(jù)分析之pandas比較操作
- Python數(shù)據(jù)分析入門之?dāng)?shù)據(jù)讀取與存儲(chǔ)
- Python數(shù)據(jù)分析入門之教你怎么搭建環(huán)境
- python數(shù)據(jù)分析之公交IC卡刷卡分析
- Python數(shù)據(jù)分析庫pandas高級(jí)接口dt的使用詳解
- 用Python 爬取貓眼電影數(shù)據(jù)分析《無名之輩》
- 高考要來啦!用Python爬取歷年高考數(shù)據(jù)并分析