三文快速入门Pandas

Get新知识:
dataframe 常用函数
head() 和 tail()
head 用于查看前几行数据,可以传入整型参数查看指定前几行的数据,tail 查看后几行数据,原理同head类似。
unique() 和 nunique()
unique() 用于显示当前数据 中全部的唯一值,nunique() 用于查看当前数据有几个唯一值。
count() 和 value_counts()
count() 返回当前数据的 非空数据的个数,value_counts() 返回当前数据每种类别各有几条数据。
descripe() 和 info()
describe() 用于查看数据源的统计信息,包括均值方差标准差四分位数等统计信息,info() 可用于查看每列数据类型,缺省值情况等基本信息。
descripe() 也可以指定分位数
idxmax() 和 nlargest()
idxmax() 返回最大值的索引,idxmin 功能类似。nlargest() 返回前几个数值最大的数据,可以传参指定个数。
clip() 和 replace()
clip() 方法接受两个整型参数,第一个指明小于该数值数据全部以该数据替代,第二个指明大于该数值全部以该数据替代。df['Math'].clip(33,80)
replace() 方法是对指定值进行替换。
df['Address'].replace(['street_1','street_2'],['one','two'])
df.replace({'Address':{'street_1':'one','street_2':'two'}})
两种写法功能一致。
sort_index() 和 sort_values()
sort_index() 方法以数据源的行标签进行排序,按行操作进行排序,ascending 指定是否升序,默认升序。
sort_values() 方法以数据源某几列的数据进行排序,默认升序,可以同时传入多列按多列进行排序。
df2 = df1.sort_index(ascending=False)
print(df2)
df3 = df1.sort_values(by="ax", ascending=False)
print(df3)