1.1什么是数据科学
1.2数据科学的应用
1.3数据科学的过程
结果展示 形象
1.4数据科学的方法
聚类:相同相似数据
2.1获取数据
三种类型 数据型(社交网络 开发者科研) 应用型 (图片和数据结合紧密flicker 谷歌图片搜素地图) 资源型(亚马逊 flicker图片存储)
2.2数据质量检验
2.3数据清洗
2.4数据集成
2.5数据集成
数据规约
2.6数据变换
属性规约 为了缩减
属性构造 展示数据的特性