监督学习:从数据集里挖算法,首先提一个模型,然后拿数据做训练,训练完去验证,如果好用,就可以去部署它了。
维度诅咒:样本特征越多,需要搜集的样本数量也越多。
收集图片:给图片打标签,雇人专门看完图片打一个标签,才能把数据集做出来。(所以打了标签的数据集非常贵)
降维:由于维度诅咒,我们把样本降维,需要的样本数量就少一点。比如,十维空间降到三维,做线性的映射或非线性的空间的映射。