机器学习之回归模型
回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量的值也随之发生变化。
回归模型是一种表示从输入变量到输出变量之间映射的函数
对连续值的预测
可以用合适的曲线揭示样本点随着自变量的变化关系
实验要求
基本要求
将数据集winequality-white.csv按照4:1划分为训练集和测试集。
构造线性回归模型,并采用批量梯度下降和随机梯度下降进行优化;输出训练集和测试集的均方误差(MSE),画出MSE收敛曲线。
对于批量梯度下降和随机梯度下降,采用不同的学习率并进行MSE曲线展示,分析选择最佳的学习率。
特别需要注意:
划分数据集时尽可能保持数据分布的一致性,保持样本类别比例相似,可采用分层采样的方式。
需要对数据集进行一定的预处理
中级要求
探究回归模型在机器学习和统计学上的差异。
回归模型在机器学习领域和统计学领域中都十分常用,而且使用方法也相似,但其实际的含义具有本质的区别。我们希望同学们从回归模型的角度更加充分地理解机器学习和统计学的区别。

高级要求
编程实现岭回归算法,求解训练样本的岭回归模型,平均训练误差和平均测试误差(解析法、批量梯度下降法和随机梯度下降法均可)。
完整代码:
中级要求
高级要求