欢迎光临散文网 会员登陆 & 注册

【python】【pandas】pandas使用笔记

2023-07-22 10:18 作者:初级换布师  | 我要投稿

数据交互或者叫文件io

python从excel文件读取数据

import pandas as pd# 读取excel文件,得到dataframe文件df = pd.read_excel(io, sheet_name, header, skiprows, index_col)# 常用参数# io: 文件路径和名称,例如 io=r'D:\file\data.xlsx',如果文件和脚本在同一路径下,则不需要指定路径,仅需要文件名# sheet_name: sheet表的名称,默认读取第一个sheet# header: 指定作为列标签的行号,默认第1行# skiprows: 需要跳过不读取的行数据# index_col: 指定作为行标签的列号,如果不指定行标签默认就是[0, 1, 2, ...]

python将数据写入excel文件

# 将dataframe文件写入excel文件df.to_excel(excel_writer)# excel_writer: 文件名

python从csv文件读取数据

import pandas as pd df = pd.read_csv(filepath_or_buffer, header, skiprows, index_col, encoding)# 常用参数# filepath_or_buffer同pd.read_excel的io# header skiprows index_col 与 pd.read_excel 相同# encoding: 默认'utf-8', 有中文时用'gbk'

python从mysql读取数据

  • 点击这里了解pandas与mysql的连接和操作

从dataframe中获取数据

最通用的是切片语法,分为按标签和按位置两种

# 按标签,其中不能混入位置编号df.loc[[行标签序列], [列标签序列]] # 例如,序列可以是列表穷举,也可以是范围生成,当然可以只取行,或者只取列df.loc['行名称1':'行名称2', ['列名称1', '列名称2']] df.loc[:, '列名称1':'列名称2']  # 只取列# 如果有行列标签没有指定,其实此时默认的行列标签0,1,2 作为str的时候就是标签,作为int的时候就是位置编号,例如df.loc['0':'2', '1':'3']# 按位置,其中不能混入标签df.iloc[[行编号序列], [列编号序列]]

简化语法,获取dataframe列数据

# 获取单列数据,得到series,一种降维操作,series的行标签是原dataframe的行标签df['列名称']或者df.列名称# 获取单列数据,得到dataframe,行列标签和原dataframe相同df[['列名称']]

简化语法,获取dataframe行数据

# 通过行编号提取数据,得到dataframe,例如提取0和1行df[0:2] # 注意,只提取0行是df[0:1]# 通过行名称提取数据,得到dataframedf['行名称1':'行名称2']# 只提取单行的话df['行名称1':'行名称1']

遍历dataframe

# 遍历行数据for index, row in df.iterrows():  # index是行编号,row就是行数据,是一个series,标签就是df的列标签


【python】【pandas】pandas使用笔记的评论 (共 条)

分享到微博请遵守国家法律