矩阵分解原理&实现

原理图示

矩阵分解算法：期望为每个用户和物品生成一个隐向量，将用户和物品定位在隐向量的表示空间上，距离相近的用户和物品表名兴趣特点接近，在推荐过程中，就应该把相近的物品推荐给目标用户。

注：k表示隐向量的维度，k的大小决定了隐向量表达能力的强弱，而k的取值要经过多次试验找到一个推荐效果和工程开销的平衡点；

原理 & 公式

对矩阵进行矩阵分解主要有三种方法：

特征值分解：只能作用于方阵，显然不适合分解用户-物品矩阵；

奇异值分解：奇异值分解要求原始的共现矩阵是稠密的，同时计算复杂度达到O(mn^2)，不适合工程实现；

梯度下降：确定目标函数，求解偏导，求取梯度下降的方向和幅度；

公式

矩阵分解公式；

基于用户矩阵和物品矩阵，用户对物品的预估评分为：

；

其中是用户在用户矩阵中的对应行向量，是物品在物品矩阵中的对应列向量；

目标函数（加入正则化项）

消除用户和物品打分偏差

其中为全局偏差常数，是物品偏差系数，可以使用物品收到的所有评分的均值；是用户偏差系数，可以使用用户给出的所有评分的均值;

优缺点

优点

泛化能力强：一定程度上解决了“协同过滤算法”中的数据稀疏问题；

空间复杂度低：只需要存储用户和物品的隐向量，空间复杂度从降低到 ;

更好的拓展性和灵活性：矩阵分解的结果便于和其他特征进行组合和拼接，并便于与深度学习网络进行无缝链接；

缺点

不方便加入用户、物品和上下文相关特征，丧失了利用很多有效信息的机会，同时缺乏用户历史行为，无法进行有效推荐；

应用场景

话题识别：对文本信息进行处理提取信息，如下图所示

特征学习：类似于主成分分析（PCA）

例如人物脸部特征学习中，利用NMF算法将人脸部不同的特征显示出来；

代码实现

recommender_system/matrix_decomposition.py at main · Hcyand/recommender_system

This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters. Learn more about bidirectional Unicode characters You can't perform that action at this time. You signed in with another tab or window.

https://github.com/Hcyand/recommender_system/blob/main/algorithm/before_deep_learning/matrix_decomposition.py


def matrix_factorization(self, r, p, q, hide):
    """
    :param r: 评分矩阵
    :param p: 用户矩阵
    :param q: 物品矩阵
    :param hide: 隐向量维度
    :return:
    """
    q = q.T
    loss_log = []
    err_old = 0  # 记录前一个的loss
    for step in range(self.steps):
        for i in range(len(r)):
            for j in range(len(r[i])):
                if r[i][j] > 0:
                    eij = r[i][j] - np.dot(p[i, :], q[:, j])
                    for k in range(hide):
                        p[i][k] = p[i][k] + self.alpha * (2 * eij * q[k][j] - self.beta * p[i][k])
                        q[k][j] = q[k][j] + self.alpha * (2 * eij * p[i][k] - self.beta * q[k][j])
        err = 0
        for i in range(len(r)):
            for j in range(len(r[i])):
                if r[i][j] > 0:
                    err = err + pow(r[i][j] - np.dot(p[i, :], q[:, j]), 2)
                    for k in range(hide):
                        err = err + (self.beta / 2) * (pow(p[i][k], 2) + pow(q[k][j], 2))
        loss_log.append(err)
        if step == 0:
            err_old = err
            continue
        if abs(err_old - err) < 1e-10:
            break
        else:
            err_old = err
        if err < 0.001:
            break

    return p, q.T, loss_log

参考文章

将m n维的共现矩阵R分解为mk维的用户矩阵 U和k*n维的物品矩阵 V相乘的形式。其中m是用户数量，n是物品数量，k是隐向量维度。k的大小决定了隐向量表达能力的强弱。k取值越小，隐向量的表达能力就越弱；反之，k取值越大，隐向量表达能力越强实例：基于用户矩阵 U和物品矩阵 V，用户u对物品i的预估评分为： r ^ u i = q i T p u \hat{r}_{ui}=q_{i}^{T}p_{u} r ^ u i = q i T p u 参数说明： q i：物品i的隐向量 p u ：用户u的隐向量这是一篇讲解矩阵分解非常详细的博文，放在这里，便于日后自己多读几遍，全面深入理解矩阵分解算法基于矩阵分解的推荐算法程序亲测有效，程序中附有详细说明 1. https://blog.csdn.net/qq_34862636/article/details/105432139

推荐系统之矩阵分解MF原理及Python实现_追梦*小生的博客-CSDN博客_python实现矩阵分解

https://blog.csdn.net/shiaiao/article/details/109119588

矩阵分解及用Python代码实现_Narogre的博客-CSDN博客_python实现矩阵分解

对于一个打分的二维矩阵，一些没有打分，我们就可以通过矩阵分解的方法来解出那些没有打分的近似数值。所谓分解矩阵就是将矩阵分解为两个矩阵的乘积。矩阵分解的过程中，将原始的评分矩阵分解成两个矩阵矩阵P(n,K)表示n个user和K个特征之间的关系矩阵，这K个特征是一个中间变量，矩阵Q(K,m)的转置是矩阵Q(m,K)，矩阵Q(m,K)表示m个item和K个特征之间的关系矩阵，这里的K值是自己控制的...

https://blog.csdn.net/Narogre/article/details/122455288

NMF（非负矩阵分解）的场景应用_图灵的猫i的博客-CSDN博客

任何关于算法、编程、AI行业知识或博客内容的问题，可以随时扫码关注公众号「图灵的猫」，加入"学习小组"，沙雕博主在线答疑~此外，公众号内还有更多AI、算法、编程和大数据知识分享，以及免费的SSR节点和学习资料。其他平台（知乎/B站）也是同名「图灵的猫」，不要迷路哦~ ...

https://blog.csdn.net/qq_39521554/article/details/79323025