一种多源海量教育数据统一集成方法

    公开(公告)号:CN118643149A

    公开(公告)日:2024-09-13

    申请号:CN202410764855.5

    申请日:2024-06-14

    Abstract: 本发明公开了一种多源海量教育数据统一集成方法,包括如下步骤:步骤1、获取学习文档、服务说明文档和事项说明文档,并进行文档加载和分块;步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入,获取文档中单词级别词向量;步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性,并根据单词级别词向量以及相似性得到句子级别词向量;步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性,并根据句子级别词向量以及相似性得到文档级别词向量;步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类,大幅度提升检索的正确性,以提升生成答案的正确率。

    一种基于异构图的个性化兴趣点推荐方法及系统

    公开(公告)号:CN114219581B

    公开(公告)日:2025-05-09

    申请号:CN202111669824.4

    申请日:2021-12-31

    Abstract: 本发明涉及一种基于异构图的个性化兴趣点推荐方法及系统。其方法包括步骤:S1获取用户‑兴趣点签到记录;S2基于签到记录构建用户‑兴趣点‑时间异构子图、用户‑类别异构子图;S3基于异构子图计算用户对于兴趣点的兴趣点偏好概率、类别偏好概率;S4基于签到记录计算用户对于兴趣点的一般签到概率,并计算兴趣点流行度;S5根据兴趣点的经纬度和签到记录,计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率;S6基于兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率,预测用户对兴趣点的总体签到概率;S7基于总体签到概率,对用户进行兴趣点推荐。在推荐兴趣点时综合考虑了多种重要因素,提高了兴趣点推荐的准确性。

    一种基于多示例学习的工业互联网专利识别方法

    公开(公告)号:CN114330314B

    公开(公告)日:2025-05-02

    申请号:CN202111593675.8

    申请日:2021-12-22

    Abstract: 本发明涉及一种基于多示例学习的工业互联网专利识别方法,利用自然语言处理技术,将专利中的摘要信息切分成句子,并利用基于句子关系图的文本主题句抽取算法来抽取摘要中的主题句,可以有效减少计算开销。同时通过结合标题和摘要中抽取的主题句,将专利转换为为句子包,其中每个专利看作包,包中的每个句子看作示例。最后,通过采用K近邻算法(K Nearest Neighbors,KNN)来预测新样本的类别。通过本发明方法能有效提高工业互联网专利识别效果,极大地减少人工审查代价,对专利检索有着非常重要的意义。

    一种因子感知图阶段性负采样表示学习个性化服务方法

    公开(公告)号:CN118377965B

    公开(公告)日:2025-04-11

    申请号:CN202410526812.3

    申请日:2024-04-29

    Abstract: 本发明公开了一种因子感知图阶段性负采样表示学习个性化服务方法,步骤如下:S1、输入用户的历史标记数据;S2、根据用户和服务之间的交互构建用户‑服务邻接矩阵;S3、构建负样本候选集合;S4、在无向图G中迭代地执行图卷积生成用户和物品的嵌入表征;S5、利用解耦技术分解出负因子,并对负因子的语义进行约束;S6、利用用户增强挑选出真正的负面实例以进行训练;S7、将正负实例与真负实例相结合,生成合成的硬负实例,以进行进一步性能优化;S8、对正面实例和令人困惑的正面实例之间进行迁移学习;S9、将用户和服务在不同层的嵌入表示相加作为最终表示;S10、推荐:计算最终表示的内积作为每个服务的推荐得分,为用户推荐分数最高的若干个服务。

Patent Agency Ranking