Python數據分析處理(三)--運動員信息的分組與聚合

這篇文章主要介紹了根據Python數據清洗與處理的相關資料，展開運動員信息的分組與聚合的文章內容。首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取，并且將數據轉換成為dataframe的格式給對象，做初始化，方便后面進行數據的分析。

推薦度：

點擊下載本文 文檔為doc格式

導讀這篇文章主要介紹了根據Python數據清洗與處理的相關資料，展開運動員信息的分組與聚合的文章內容。首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取，并且將數據轉換成為dataframe的格式給對象，做初始化，方便后面進行數據的分析。

1、數據的爬取

代碼：

import?pandas?as?pd
f?=?open('運動員信息表.csv')
data=pd.read_csv(f,skiprows=0,header=0)
print(data)

運行結果：

首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取，并且將數據轉換成為dataframe的格式給對象，做初始化，方便后面進行數據的分析。

2、統計男籃、女籃運動員的平均年齡、身高、體重

代碼：

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])

print(sex.mean())

運行結果：

首先我們先把數據提取出來做個分組，先把"年齡（歲）",“身高(cm)”,"體重(kg)"這三行數據提取出來再根據性別進行分組。

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])

然后再調用mean()求平均值，求出男籃、女籃運動員的平均年齡、身高、體重。

3、統計男籃運動員年齡、身高、體重的極差值

代碼：

sex=data[["年齡（歲）","身高(cm)","體重(kg)"]].groupby(data["性別"])
basketball_male=dict([x?for?x?in?sex])['男']
basketball_male
#求極差
def?range_data_group(arr):
????return?arr.max()-arr.min()
#進行每列不同的聚合
basketball_male.agg({
"年齡（歲）":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group
})

運行結果：

首先提取數據：

單行循環提取數據，dict([x for x in sex])在循環體內的語句只有一行的情況的下，可以簡化for循環的書寫。定義一個函數def range_data_group(arr):求極差；

極差的求法：使用最大值減去最小值。就得到極差。

agg()函數：DataFrame.agg（*func*，*axis = 0*，* args*，*** kwargs* ）*

func : 函數，函數名稱，函數列表，字典{‘行名/列名’，‘函數名’}

使用指定軸上的一個或多個操作進行聚合。

需要注意聚合函數操作始終是在軸（默認是列軸，也可設置行軸）上執行，不同于 numpy聚合函數

最后我們可以得到三列數據：分別對應"年齡（歲）",“身高(cm)”,“體重(kg)”。

4 、統計男籃運動員的體質指數4.1添加體重指數

代碼：

data["體質指數"]=0
data

運行結果：

添加一行體重指數：data[“體質指數”]=0

4.2計算bmi值并添加數據

代碼：

#?計算bmi數值
def?outer(num):
????def?bminum(sumbim):
????????weight=data["身高(cm)"]
????????height=data["體重(kg)"]
????????sumbim=weight/(height/100)**2
????????return?num+sumbim
????return?bminum

將該行數據添加上去：

代碼：

#?調用函數
bimdata=data["體質指數"]
data["體質指數"]=data[["體質指數"]].apply(outer(bimdata))
data

運行結果:

編寫函數計算bmi數值 outer(num)；然后再使用apply的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))97622)]

編寫函數計算bmi數值 outer(num) ；然后再使用apply的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))

到此這篇關于Python數據分析處理，運動員信息的分組與聚合的文章就介紹到這了。更多相關Python數據分析處理內容請搜索好二三四，希望大家以后多多支持好二三四！

Python數據分析處理(三)--運動員信息的分組與聚合

推薦度：

點擊下載本文 文檔為doc格式

為你推薦

資訊專欄

熱門視頻

相關推薦

科技

美食

生活

娛樂

健康

母嬰

教育

體育

更多

汽車

游戲

旅游

時尚

財經

寵物

視頻號

抖音

快手

微博

首頁

職業培訓

IT技術

詩詞國學

學說英語

學習計劃

藝術文化

名言諺語

教育百科

Python數據分析處理(三)--運動員信息的分組與聚合

Python數據分析處理(三)--運動員信息的分組與聚合

Python數據分析處理(三)--運動員信息的分組與聚合