更新時間:2022年11月02日15時11分 來源:傳智教育 瀏覽次數(shù):
Pandas為我們提供了非常多的描述性統(tǒng)計分析的指標(biāo)方法,比如總和、均值、最小值、最大值等。接下來,筆者來羅列一些常用的描述性統(tǒng)計方法,以及它們的具體說明。
1.sum:計算和
2.mean:計算平均值
3.median:獲取中位數(shù)
4.max、min:獲取最大值和最小值
5.idxmax、idxmin:獲取最大和最小索引值
6.count:計算非NaN值的個數(shù)
7.head:獲取前N個值
8.var:樣本值的方差
9.std:樣本值的標(biāo)準(zhǔn)差
10.skew:樣本值的偏度(三階矩)
11.kurt:樣本值的峰度(四階矩)
12.cumsum:樣本值的累計和。
13.cummin、cummax:樣本值的累積最小值和累積最大值。
14.cumpord:樣本值的累計積。
15.describe:對Series和DataFrame列計算匯總統(tǒng)計。
下面通過一些示例來演示上述部分方法的使用。例如,創(chuàng)建一個3行4列的DataFrame對象,它的列索引為“a、b、c、d”,具體代碼如下。
In [59]: df_obj = pd.DataFrame(np.arange(12).reshape(3, 4), columns=['a', 'b', 'c', 'd']) df_obj Out[59]: a b c d 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11
然后,讓DataFrame對象依次調(diào)用sum()、max()和min()方法,分別執(zhí)行求和、求最大值和最小值的運算,具體代碼如下。
In [60]: df_obj.sum() #計算每列的和 Out[60]: a 12 b 15 c 18 d 21 dtype: int64 In [61]: df_obj.max() # 獲取每列的最大值 Out[61]: a 8 b 9 c 10 d 11 dtype: int32 In [62]: df_obj.min(axis=1) # 沿著橫向軸,獲取每行的最小值 Out[62]: 0 0 1 4 2 8 dtype: int32
通過結(jié)果可以看出,DataFrame默認(rèn)優(yōu)先以縱向軸進(jìn)行計算,除非在調(diào)用這些統(tǒng)計方法時,顯式地指明沿著橫向軸方向,即aixs=1,才會對每行的數(shù)據(jù)進(jìn)行計算。