欢迎光临散文网 会员登陆 & 注册

数据技术课堂2021数据分析实战

2022-09-28 14:25 作者:janet19961217  | 我要投稿

1.1 认识和理解数据

In [ ]

import seaborn as snsimport pandas as pd# tit = sns.load_dataset("titanic")  # 从网站直接下载。# 或者直接通过函数加载。data = pd.read_csv("work/titanic.csv")  # 加载后的文件是一个dataframe 格式的文件。

In [ ]

##观察和理解数据# data.shape  #观察数据规模# data.describe() #数据分布描述# data.head(5) #前五条数据记录

In [ ]

data.columns  # 列出所有字段# 学习相关知识,了解每个字段的含义。Index(['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare',       'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town',       'alive', 'alone'],      dtype='object')


数据技术课堂2021数据分析实战的评论 (共 条)

分享到微博请遵守国家法律