一种基于Google Bert的文档推荐方法及系统

    公开(公告)号:CN116166775A

    公开(公告)日:2023-05-26

    申请号:CN202310026053.X

    申请日:2023-01-09

    Abstract: 本发明公开了一种基于Google Bert的文档推荐方法及系统,属于文字采矿和信息挖掘等自然语言处理技术领域。该方法包括:获取输入的文本数据,并对其进行预处理,将所述文本数据转化为索引数组;使用Bert模型对所述索引数组进行编码,获取所述索引数组的最终编码;将所述索引数组的最终编码进行0.1的Dropout,并通过softmax计算得到相似度;根据所述相似度对文档进行排序,输出要推荐的文档。本发明提出的基于Google Bert的文档推荐方法通过预测屏蔽子词(先将句子中的部分子词屏蔽,再令模型去预测被屏蔽的子词)进行训练的这种方式在语句级的语义分析中取得了极好的效果。

    一种融合动态邻居和静态邻居信息的自监督学习推荐方法

    公开(公告)号:CN118445478A

    公开(公告)日:2024-08-06

    申请号:CN202410540364.2

    申请日:2024-04-30

    Abstract: 本发明公开了一种融合动态邻居和静态邻居信息的自监督学习推荐方法,属于个性化推荐技术领域。包括:从公开数据中获取用户‑项目交互图以及用户社交图,建立数据集;构建基于轻量级图卷积网络LightGCN和贝叶斯个性化排序算法的推荐模型;构建静态隐式邻居集合、静态显式邻居集合以及动态邻居集合用于对LightGCN进行对比学习;结合模型训练和对比学习构建总的损失函数对模型进行优化。本发明结合了动态邻居和静态邻居的概念来进行推荐,能够捕捉到用户特征的细微变化,从而使推荐更加个性化和精准。同时利用了用户社交网络中的数据以及用户和项目之间的交互数据,解决了数据稀疏性问题,也为推荐系统提供了丰富且个性化的视角。

Patent Agency Ranking