欢迎光临散文网 会员登陆 & 注册

pandas DataFrame对象实例:NBA球员名单、NFL球员

2023-07-27 17:05 作者:矢来美羽MIUYARAI  | 我要投稿

DataFrame与Series不同的是,后者是一维,前者是二维,可以有多个column(列标题,行的标签),例如:

转置:.transpose().T

np的random模块生成[1,101)之间随机、3行5列DataFrame:

自定义标签:index=、columns=

NBA球员名单

19-20赛季,包括姓名(Name)、球队(Team)、场上位置(Position)、生日(Birthday)、薪水(Salary):nba.csv

文件:https://pan.baidu.com/s/1Z2SqtM8kErIxa3Z4GjfzhQ?pwd=1234

将生日字符转为日期:parse_dates = ["Birthday"]

保存为nba变量:

极值

每列中的极值

Salary最高的4个极值

写法1

写法2

常见统计:(针对数值限定)

numeric_only = True:不统计其他列

.round(1):保留一位小数

中位数:

多列排序

Team升序、Salary降序,

按索引排序(行/列)

行索引:(数字大小)

列索引:换到第二维1(0对应row,1对应column),按照字母

用Name作为行索引

数字修改为Name:

读文件的时候直接用Name:

DataFrame中选择列

用列名选择:

用包含/排除数据类型选择:(字符串object、整数int、日期datetime)

DataFrame中选择行

loc标签索引:

切片:(包含上限)

iloc位置索引:(序号)

切片:(不包含上限)

行列提取

标签依然loc(可切片)

序号iloc:

* 查找单个值时,用at、iat替换loc、iloc能小幅度提升速度。

Series方式访问:

行列标签修改

直接赋值:

rename()法赋值:

索引修改

改为默认:

改为Team:(直接改会丢失之前改好的Name)


pandas DataFrame对象实例:NBA球员名单、NFL球员的评论 (共 条)

分享到微博请遵守国家法律