北大公开课-人工智能基础 65 机器学习的模型之几何模型



拓扑学是研究空间的性质和变形的学科,而流形是拓扑学中的一个概念,是可以局部欧几里得空间化的一个拓扑空间。123
简单来说,拓扑学研究的是空间的性质,而流形则是一种特殊的空间。
【欧几里得空间】
欧几里得空间是指一类特殊的向量空间,对通常3维空间V3中的向量可以讨论长度、夹角等几何性质。
简单来说,欧几里得空间就是中学平面几何或者立体几何所处的空间,其中定义了各种中学就学过的概念,比如距离 d (x,y)=sqrt { (x_1-y_1)^2+ (x_2-y_2)^2+ (x_3-y_3)^2} 就是点 x 和点 y 在三维空间中的距离,还有内积 vec xcdotvec y=x_1y_1+x_2y_2+x_3y_3 就是向量 vec x 和向量 vec y 的内积。
【数学空间】
数学中有很多种空间,其中比较常见的有:线性空间、度量空间、拓扑空间、希尔伯特空间、巴拿赫空间等。
——线性空间是定义了加法和数乘的空间,它是线性代数的基础。
——向量空间,又称线性空间,是线性代数的中心内容和基本概念之一。1 向量空间定义为带有加法和标量乘法的集合 V。2 向量空间是一个满足八条性质的集合,包括加法结合律、加法交换律、加法单位元、加法逆元、标量乘法结合律、标量乘法分配律、标量乘法单位元和标量乘法分配律。向量空间是一种对几何上向量空间的一个推广,因此向量空间像几何空间是有着相同特质的量的集合,并且在集合上面定义了一套运算规则。
——度量空间是定义了距离的空间,它是分析学的基础。2
——拓扑空间是定义了开集和闭集的空间,它是拓扑学的基础。2
——希尔伯特空间是定义了内积的完备线性赋范空间,它是量子力学的基础。4
——巴拿赫空间是完备的赋范线性空间,它是泛函分析的基础。3


类似于瑞士卷的展开,高维降维



等距映射(Isomap)是一种非线性降维算法,它可以将高维数据映射到低维空间中,同时保留数据的局部几何结构。等距映射算法通过计算数据点之间的最短路径距离来估计流形的测地距离,从而实现了对高维数据的降维。等距映射算法是一种高效的降维方法,可以广泛应用于各种来源和不同维度的数据。


近似拟合


LLE算法的主要思想是在低维空间保持了原始高维空间样本邻域内的线性关系,这也是局部线性嵌入算法的名称来源。

瑞士卷的展开

拉普拉斯特征映射算法(Laplacian Eigenmaps)是一种基于图的降维算法,它希望相互间有关系的点(在图中相连的点)在降维后的空间中尽可能的靠近,从而在降维后仍能保持原有的数据结构。
拉普拉斯特征映射算法所产生的映射可以看作是对几何流形的一种连续离散逼近的映射,用数据点的邻域图来近似表示流形,并用Laplace-Beltrami 算子近似表示邻域图的权值矩阵,实现高维流形的最优嵌入。

