pandas DataFrame对象实例:NBA球员名单、NFL球员
2023-07-27 17:05 作者:矢来美羽MIUYARAI | 我要投稿
DataFrame与Series不同的是,后者是一维,前者是二维,可以有多个column(列标题,行的标签),例如:

转置:.transpose()或.T

np的random模块生成[1,101)之间随机、3行5列DataFrame:
自定义标签:index=、columns=

NBA球员名单
19-20赛季,包括姓名(Name)、球队(Team)、场上位置(Position)、生日(Birthday)、薪水(Salary):nba.csv
文件:https://pan.baidu.com/s/1Z2SqtM8kErIxa3Z4GjfzhQ?pwd=1234
将生日字符转为日期:parse_dates = ["Birthday"]

保存为nba变量:
极值
每列中的极值

Salary最高的4个极值
写法1
写法2

常见统计:(针对数值限定)
numeric_only = True:不统计其他列
.round(1):保留一位小数

中位数:

多列排序
Team升序、Salary降序,

按索引排序(行/列)
行索引:(数字大小)

列索引:换到第二维1(0对应row,1对应column),按照字母

用Name作为行索引
数字修改为Name:
读文件的时候直接用Name:
DataFrame中选择列
用列名选择:
用包含/排除数据类型选择:(字符串object、整数int、日期datetime)
DataFrame中选择行
loc标签索引:
切片:(包含上限)

iloc位置索引:(序号)
切片:(不包含上限)

★行列提取
标签依然loc(可切片)

序号iloc:
* 查找单个值时,用at、iat替换loc、iloc能小幅度提升速度。
Series方式访问:
行列标签修改
直接赋值:
rename()法赋值:
索引修改
改为默认:
改为Team:(直接改会丢失之前改好的Name)