欢迎光临散文网 会员登陆 & 注册

ApacheCN 机器学习实战讲义 十四、利用SVD简化数据

2018-05-03 00:05 作者:绝不原创的飞龙  | 我要投稿

SVD 概述

奇异值分解(SVD, Singular Value Decomposition):    提取信息的一种方法,可以把 SVD 看成是从噪声数据中抽取相关特征。从生物信息学到金融学,SVD 是提取信息的强大工具。

SVD 场景

信息检索-隐性语义检索(Lstent Semantic Indexing, LSI)或 隐性语义分析(Latent Semantic Analysis, LSA)

隐性语义索引:矩阵 = 文档 + 词语 * 是最早的 SVD 应用之一,我们称利用 SVD 的方法为隐性语义索引(LSI)或隐性语义分析(LSA)。

LSA举例

推荐系统

  1. 利用 SVD 从数据中构建一个主题空间。

  2. 再在该空间下计算其相似度。(从高维-低维空间的转化,在低维空间来计算相似度,SVD 提升了推荐系统的效率。)

主题空间案例1
  • 上图右边标注的为一组共同特征,表示美式 BBQ 空间;另一组在上图右边未标注的为日式食品 空间。

图像压缩

例如:32*32=1024 => 32*2+2*1+32*2=130(2*1表示去掉了除对角线的0), 几乎获得了10倍的压缩比。

SVD公式

阅读全文:http://ml.apachecn.org/mlia/svd/

ApacheCN 机器学习实战讲义 十四、利用SVD简化数据的评论 (共 条)

分享到微博请遵守国家法律