数据技术课堂2021数据分析实战
2022-09-28 14:25 作者:janet19961217 | 我要投稿
1.1 认识和理解数据
In [ ]
import seaborn as snsimport pandas as pd# tit = sns.load_dataset("titanic") # 从网站直接下载。# 或者直接通过函数加载。data = pd.read_csv("work/titanic.csv") # 加载后的文件是一个dataframe 格式的文件。
In [ ]
##观察和理解数据# data.shape #观察数据规模# data.describe() #数据分布描述# data.head(5) #前五条数据记录
In [ ]
data.columns # 列出所有字段# 学习相关知识,了解每个字段的含义。
Index(['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare',
'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town',
'alive', 'alone'],
dtype='object')