一种多源海量教育数据统一集成方法

    公开(公告)号:CN118643149A

    公开(公告)日:2024-09-13

    申请号:CN202410764855.5

    申请日:2024-06-14

    Abstract: 本发明公开了一种多源海量教育数据统一集成方法,包括如下步骤:步骤1、获取学习文档、服务说明文档和事项说明文档,并进行文档加载和分块;步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入,获取文档中单词级别词向量;步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性,并根据单词级别词向量以及相似性得到句子级别词向量;步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性,并根据句子级别词向量以及相似性得到文档级别词向量;步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类,大幅度提升检索的正确性,以提升生成答案的正确率。

Patent Agency Ranking