欢迎光临散文网 会员登陆 & 注册

Data Science in Python Data Prep EDA

2023-07-29 08:20 作者:仿真资料吧  | 我要投稿

学习|语言:英语|时长:180讲(8小时41米)|大小:3.17 GB

了解如何使用Python和Pandas为数据科学和机器学习收集、清理、探索和分析数据

你将学到什么

  • 在应用机器学习算法之前,掌握Python数据科学的核心构建块

  • 通过明确定义分析所需的目标、技术和数据源,确定数据科学项目的范围

  • 使用Pandas导入和导出平面文件、Excel工作簿和SQL数据库表

  • 通过转换数据类型、处理常见数据问题和创建新列进行分析来清理数据

  • 通过对数据进行排序、筛选、分组和可视化来执行探索性数据分析(EDA),以发现模式和见解

  • 通过连接表、聚合行和应用特征工程技术为机器学习模型准备数据

描述

旨在帮助您掌握Python在数据科学中的核心构建块。首先介绍数据科学和机器学习领域,讨论有监督和无监督学习之间的区别,以及回顾我们将在整个课程中使用的数据科学工作流程;

工作流的EDA步骤。您将学习如何确定数据科学项目的范围,使用Pandas从多个来源收集数据并处理常见的数据清理问题,以及使用过滤、分组和可视化数据等技术进行探索性数据分析。

最后但并非最不重要的是,您将通过连接多个表、调整行粒度以及设计有用的字段和功能来练习为机器学习模型准备数据。

概述:数据科学简介介绍数据科学领域,回顾基本技能,并介绍数据科学工作流程的每个阶段界定项目范围回顾数据科学项目的界定过程,包括集思广益解决问题、选择技术和设定明确目标在Python中将DataRead平面文件收集到Pandas DataFrame中,并审查通用数据源&格式,包括Excel电子表格和SQL数据库清理数据识别和转换数据类型,查找和修复常见的数据问题,如缺失值、重复值和异常值,并为分析创建新列探索性数据分析探索数据集,通过对数据进行排序、筛选和分组来发现见解,然后使用散点图等常见图表类型将其可视化;探索和可视化数据来测试您的技能准备建模通过创建数字、非空表和设计新功能来构建数据,以便为机器学习模型做好准备;

链接:https://pan.baidu.com/s/1oqP9NE97WmguDBWAGN4QIw 

提取码:1945 

--来自百度网盘超级会员V6的分享


Data Science in Python Data Prep EDA的评论 (共 条)

分享到微博请遵守国家法律