PMF概率矩阵分解介绍

文档
由于文章涉及到了很多公式,排版不太方便,可以通过gitee上的链接下载pdf和md版本的文档进行查看。
https://gitee.com/youryouth/mc/tree/63c879c1b2aa0e942e3c00820744e79553c6e501/pmf


矩阵分解的困难
由于系统噪音的存在,不可能做出完美的分解
评分矩阵R中包含很多未知元素(稀疏矩阵)
贝叶斯观点
评分矩阵R是系统观测值
用户和项目隐特征矩阵U和V可看作系统内部特征,是需要估计的参数
p(X)是一个常数。
PMF
U是一个N×D矩阵,其中N是用户数,D是rank的维度。V是D×M矩阵,其中M是要的项目数。因此,N×M的评级矩阵R可以通过以下方式近似补全
我们的目标是找到合适的U和V。因为U和V是原始矩阵的低秩矩阵,所以PMF也被称为低秩矩阵分解问题。此外,U和V矩阵的这一特殊特征使得PMF甚至对于包含数百万条记录的数据集也可扩展。
PMF从贝叶斯学习中得出的直觉用于参数估计。一般而言,我们是想借助贝叶斯规则来找到模型参数的后验分布,假设有如下参数。
在这里,X是我们的数据集,等于原始的评分矩阵R,θ是分布的参数或参数集,是优化求解的目标U和V,α是分布的超参数,σ是零均值球形高斯分布的标准偏差。
训练过程的整体思路是,随着我们获得有关数据分布的更多信息,我们将调整模型参数θ以适合数据。从技术上讲,后验分布的参数将插入到先前的分布中,以进行训练过程的下一次迭代。也就是说,给定训练步骤的后验分布最终将成为下一步骤的先验。重复该过程,直到步骤之间的后验分布几乎没有变化为止。
在这里,
是后验分布,
和
是先验分布,
是似然分布。

U和V,R或者X是我们的数据集。经过训练后,我们将得到一个补全后的R矩阵,该矩阵还将包含对原始矩阵空缺的评分。等等
结论
本文给出了概率矩阵分解(PMF)及其两个导数:先验可学习的PMF和约束PMF。 我们还证明了这些模型可以有效地训练,并成功地应用于包含超过1亿个电影评分的大型数据集。
但初步结果强烈表明,对所提出的PMF模型进行全面的贝叶斯处理将导致预测精度的显著提高。
参考
https://www.bilibili.com/video/BV1Ti4y1S7Vh?p=11&vd_source=2168ec090b7e16082ad7fc7264c30fe5
https://www.cnblogs.com/Matrix420/p/5140820.html
https://datalearner.com/blog/1051507818535686
https://zhuanlan.zhihu.com/p/34422451