ApacheCN 机器学习实战讲义 十四、利用SVD简化数据

SVD 概述
奇异值分解(SVD, Singular Value Decomposition):
提取信息的一种方法,可以把 SVD 看成是从噪声数据中抽取相关特征。从生物信息学到金融学,SVD 是提取信息的强大工具。
SVD 场景
信息检索-隐性语义检索(Lstent Semantic Indexing, LSI)或 隐性语义分析(Latent Semantic Analysis, LSA)
隐性语义索引:矩阵 = 文档 + 词语 * 是最早的 SVD 应用之一,我们称利用 SVD 的方法为隐性语义索引(LSI)或隐性语义分析(LSA)。

推荐系统
利用 SVD 从数据中构建一个主题空间。
再在该空间下计算其相似度。(从高维-低维空间的转化,在低维空间来计算相似度,SVD 提升了推荐系统的效率。)

上图右边标注的为一组共同特征,表示美式 BBQ 空间;另一组在上图右边未标注的为日式食品 空间。
图像压缩
例如:32*32=1024 => 32*2+2*1+32*2=130
(2*1表示去掉了除对角线的0), 几乎获得了10倍的压缩比。

阅读全文:http://ml.apachecn.org/mlia/svd/