pandas DataFrame对象实例：NBA球员名单、NFL球员

2023-07-27 17:05 作者:矢来美羽MIUYARAI 0人读过 | 我要投稿

DataFrame与Series不同的是，后者是一维，前者是二维，可以有多个column（列标题，行的标签），例如：

转置：.transpose()或.T

np的random模块生成[1,101)之间随机、3行5列DataFrame：

自定义标签：index=、columns=

NBA球员名单

19-20赛季，包括姓名（Name）、球队（Team）、场上位置（Position）、生日（Birthday）、薪水（Salary）：nba.csv

文件：https://pan.baidu.com/s/1Z2SqtM8kErIxa3Z4GjfzhQ?pwd=1234

将生日字符转为日期：parse_dates = ["Birthday"]

保存为nba变量：

极值

每列中的极值

Salary最高的4个极值

写法1

写法2

常见统计：（针对数值限定）

numeric_only = True：不统计其他列

.round(1)：保留一位小数

中位数：

多列排序

Team升序、Salary降序，

按索引排序（行/列）

行索引：（数字大小）

列索引：换到第二维1（0对应row，1对应column），按照字母

用Name作为行索引

数字修改为Name：

读文件的时候直接用Name：

DataFrame中选择列

用列名选择：

用包含/排除数据类型选择：（字符串object、整数int、日期datetime）

DataFrame中选择行

loc标签索引：

切片：（包含上限）

iloc位置索引：（序号）

切片：（不包含上限）

★行列提取

标签依然loc（可切片）

序号iloc：

* 查找单个值时，用at、iat替换loc、iloc能小幅度提升速度。

Series方式访问：

行列标签修改

直接赋值：

rename()法赋值：

索引修改

改为默认：

改为Team：（直接改会丢失之前改好的Name）

标签：