Data Science In Python: Regression & Forecasting
语言:英语|尺寸:3.19 GB |持续时间:8小时31米
学习Python用于数据科学和机器学习,并通过实践项目构建回归和预测模型
你将学到什么
掌握Python中回归分析的机器学习基础
对模型特征、目标及其之间的关系进行探索性数据分析
使用Statsmodels和Scikit Learn构建和解释简单和多元线性回归模型
使用假设检验、残差图和平均误差度量等工具评估模型性能
诊断并修复对线性回归模型假设的违反
通过数据拆分、验证和交叉验证以及模型评分来调整和测试您的模型
利用正则化回归算法提高测试模型的性能和准确性
采用时间序列分析技术来识别趋势和季节性,进行分解并预测未来价值
要求
我们强烈建议您先参加我们的数据准备和EDA课程
Jupyter笔记本(免费下载,我们将完成安装)
建议熟悉基本Python和Pandas,但不是必需的
描述
这是一门基于项目的实践课程,旨在帮助您掌握Python中回归分析的基础。我们将从回顾数据科学工作流程开始,讨论回归分析的主要目标和类型,并深入了解我们将在整个课程中使用的回归建模步骤。您将学会执行探索性数据分析,拟合简单的多元线性回归模型,并使用假设检验、残差图和误差度量等工具建立解释模型和评估其性能的直觉。我们还将回顾线性回归的假设,并学习如何诊断和修复每一个假设。从那里,我们将介绍有助于确保我们的模型在新的、看不见的数据上表现良好的模型测试和验证步骤,包括数据拆分、调整和模型选择的概念。您还将学习如何利用特征工程技术和正则化回归算法来提高模型性能。在整个课程中,您将在专注于客户定价策略的团队中担任Maven咨询集团的副数据科学家。利用你在整个课程中学到的技能,你将使用Python来探索他们的数据并建立回归模型,以帮助公司准确预测价格并了解影响价格的变量。最后但并非最不重要的是,你将了解时间序列分析和预测技术。您将学习分析趋势和季节性,执行分解和预测未来价值。课程大纲:数据科学简介介绍数据科学和机器学习领域,复习基本技能,并介绍数据科学工作流程的每个阶段回归101复习回归的基础,包括关键术语、回归分析的类型和目标,以及回归建模工作流预建模数据准备和EDARecap执行建模所需的数据准备和EDA步骤,包括探索目标、特征、,及其关系简单线性回归在Python中构建简单的线性回归模型,了解有助于评估其质量和输出的指标和统计测试多重线性回归在Python中构建多重线性回归模型并评估模型拟合度,执行变量选择,并使用误差度量对模型进行比较模型假设查看需要满足的线性回归模型假设,以确保模型的预测和解释是有效的模型测试和验证通过拆分数据、使用训练和验证数据调整模型、选择最佳模型来测试模型性能,并在测试数据上进行评分特征工程将特征工程技术应用于回归模型,包括伪变量、交互项、装箱和更多正则化回归引入正则化回归技术,这些技术是线性回归的替代品,包括Ridge、Lasso、,和弹性网回归时间序列分析学习探索时间序列数据的方法,以及如何使用线性回归和Facebook Prophet进行时间序列预测__________准备好深入研究了吗?立即加入,终身访问以下内容:8.5小时的高质量视频14个家庭作业10个测验3个项目Python中的数据科学:回归电子书(230多页)可下载的项目文件和解决方案专家支持和问答论坛30天Udemy满意度保证如果你是一位有抱负的数据科学家,正在寻找Python回归建模世界的介绍,这是你的课程。学习愉快-Chris Bruehl(数据科学专家兼首席Python讲师,Maven Analytics)
概述
第1节:入门
第1讲课程简介
第二讲本系列
第三讲课程结构与大纲
第4讲阅读我:给新生的重要笔记
第5讲下载:课程资源
第六讲课程项目介绍
第7讲设定期望
讲座8 Jupyter的安装和发布
第二节:数据科学导论
第九讲什么是数据科学?
第10讲数据科学技能
第11讲什么是机器学习?
第12讲常见的机器学习算法
第13讲数据科学工作流程
第14讲第1步:界定项目范围
第15讲第2步:收集数据
第16讲第3步:清理数据
第17讲第4步:探索数据
第18讲第5步:建模数据
第19讲第6步:分享见解
第20讲回归建模
第21讲主要收获
第3节:回归101
第22讲回归101
第23讲回归目标
第24讲回归的类型
第25讲回归建模工作流程
第26讲主要收获
第4节:建模前数据准备和EDA
第27讲回归EDA
第28讲探索目标
第29讲探索特色
第30讲作业:探索目标和特点
第31讲解决方案:探索目标和特点
第32讲线性关系与相关性
第33讲Python中的线性关系
第34讲特征-目标关系
第35讲特征-特征关系
第36讲专业提示:配对图与就业
第37讲任务:探索人际关系
第38讲解决方案:探索人际关系
第39讲建模准备
第40讲要点
第5节:简单线性回归
第41讲简单线性回归
第42讲线性回归模型
第43讲最小二乘误差
第44讲Python中的线性回归
第45讲统计模型中的线性回归
第46讲模型解读
第47讲预测
第48讲R-Squared
第49讲假设检验
第50讲F-Test
第51讲系数估计与P值
第52讲残差图
第53讲案例研究:健康保险价格建模
第54讲作业:简单线性回归
第55讲解决方案:简单线性回归
第56讲要点
第6节:多元线性回归
第57讲多元线性回归方程
第58讲拟合多元线性回归
第59讲多元线性回归模型的解释
第60讲变量选择
第61讲作业:多元线性回归
第62讲解决方案:多元线性回归
第63讲平均误差度量
第64讲DEMO:平均误差度量
第65讲调整后的R平方
第66讲作业:平均误差度量
第67讲解决方案:平均误差度量
第68讲主要收获
第7节:模型假设
第69讲线性回归的假设
第70讲线性
第71讲错误的独立性
第72讲误差的正态性
第73讲DEMO:错误的正常性
第74讲PRO TIP:解释转换目标
第75讲没有完美多共线
第76讲误差的等方差
第77讲局外人、杠杆和影响力
第78讲RECAP:线性回归的假设
第79讲作业:模型假设
第80讲解决方案:模型假设
第81讲要点
第8节:模型测试与验证
第82讲模型评分步骤
第83讲数据拆分
第84讲合身与不合身
第85讲偏差-方差权衡
第86讲验证数据
第87讲模型调整
第88讲模型评分
第89讲交叉验证
第90讲简单与交叉验证
第91讲作业:模型测试与验证
第92讲解决方案:模型测试与验证
第93讲要点
第9节:特征工程
第94讲特征工程导论
第95讲特征工程技术
第96讲多项式项
第97讲结合特色
第98讲互动术语
第99讲分类特征
第100讲虚拟变量
第101讲DEMO:虚拟变量
第102讲分类数据的二进制化
第103讲二进制数字数据
第104讲DEMO:附加功能工程理念
第105讲作业:特征工程
第106讲解决方案:特征工程
第107讲主要收获
第10节:项目1:旧金山租金价格
第108讲项目简介
第109讲解决方案演练
第11节:正则回归
第110讲正则回归导论
第111讲山脊回归
第112讲标准化
第113讲拟合岭回归模型
第114讲演示:拟合岭回归
第115讲专业提示:RidgeCV
第116讲作业:岭回归
第117讲解决方案:岭回归
第118讲拉索回归
第119讲PRO提示:LassoCV
第120讲作业:拉索回归
第121讲解决方案:拉索回归
第122讲弹性网络回归
第123讲DEMO:拟合弹性网络回归
第124讲PRO提示:ElasticNetCV
第125讲作业:弹性网络回归
第126讲解决方案:弹性网络回归
第127讲RECAP:正则化回归模型
第128讲预览:基于树的模型
第129讲要点
第12节:项目1:旧金山租金价格(续)
第130讲项目简介
第131讲解决方案演练
第13节:时间序列分析
第132讲时间序列简介
第133讲移动平均线
第134讲演示:移动平均数
第135讲指数平滑
第136讲作业:平滑
第137讲解决方案:平滑
第138讲分解
第139讲DEMO:分解
第140讲PRO TIP:自相关图
第141讲作业:分解
第142讲解决方案:分解
第143讲预测
第144讲趋势与季节的线性回归
第145讲DEMO:趋势与季节的线性回归
第146讲Facebook先知
第147讲作业:预测
第148讲解决方案:预测
第149讲主要收获
第14节:项目2:用电量
第150讲项目简介
第151讲解决方案演练
第15节:下一步行动
第152讲附加课
链接:https://pan.baidu.com/s/1RMVeU1_sj0zGVbA1b8vd0A
提取码:lylo
--来自百度网盘超级会员V6的分享