【python】【pandas】pandas使用笔记

2023-07-22 10:18 作者:初级换布师 0人读过 | 我要投稿

数据交互或者叫文件io

python从excel文件读取数据

import pandas as pd# 读取excel文件，得到dataframe文件df = pd.read_excel(io, sheet_name, header, skiprows, index_col)# 常用参数# io: 文件路径和名称，例如 io=r'D:\file\data.xlsx'，如果文件和脚本在同一路径下，则不需要指定路径，仅需要文件名# sheet_name: sheet表的名称，默认读取第一个sheet# header: 指定作为列标签的行号，默认第1行# skiprows: 需要跳过不读取的行数据# index_col: 指定作为行标签的列号，如果不指定行标签默认就是[0, 1, 2, ...]

python将数据写入excel文件

# 将dataframe文件写入excel文件df.to_excel(excel_writer)# excel_writer: 文件名

python从csv文件读取数据

import pandas as pd df = pd.read_csv(filepath_or_buffer, header, skiprows, index_col, encoding)# 常用参数# filepath_or_buffer同pd.read_excel的io# header skiprows index_col 与 pd.read_excel 相同# encoding: 默认'utf-8'，有中文时用'gbk'

python从mysql读取数据

点击这里了解pandas与mysql的连接和操作

从dataframe中获取数据

最通用的是切片语法，分为按标签和按位置两种

# 按标签，其中不能混入位置编号df.loc[[行标签序列], [列标签序列]] # 例如，序列可以是列表穷举，也可以是范围生成，当然可以只取行，或者只取列df.loc['行名称1':'行名称2', ['列名称1', '列名称2']] df.loc[:, '列名称1':'列名称2'] # 只取列# 如果有行列标签没有指定，其实此时默认的行列标签0,1,2 作为str的时候就是标签，作为int的时候就是位置编号，例如df.loc['0':'2', '1':'3']# 按位置，其中不能混入标签df.iloc[[行编号序列], [列编号序列]]

简化语法，获取dataframe列数据

# 获取单列数据，得到series，一种降维操作，series的行标签是原dataframe的行标签df['列名称']或者df.列名称# 获取单列数据，得到dataframe，行列标签和原dataframe相同df[['列名称']]

简化语法，获取dataframe行数据

# 通过行编号提取数据，得到dataframe，例如提取0和1行df[0:2] # 注意，只提取0行是df[0:1]# 通过行名称提取数据，得到dataframedf['行名称1':'行名称2']# 只提取单行的话df['行名称1':'行名称1']

遍历dataframe

# 遍历行数据for index, row in df.iterrows(): # index是行编号，row就是行数据，是一个series，标签就是df的列标签

标签：