非结构化文档问答的方法、装置、存储介质和设备

    公开(公告)号:CN115828893B

    公开(公告)日:2023-11-17

    申请号:CN202211501006.8

    申请日:2022-11-28

    Abstract: 本发明提供一种非结构化文档问答的方法、装置、存储介质和设备,所述方法包括:创建文档索引库,对文档进行解析,获得段落索引、句对索引和全文索引,利用召回算法从段落索引中获得最相关段落并进行答案抽取,获得段落索引结果,对待回答问题和句对索引分别进行向量化处理并计算相似度得分,将相似度得分记录大于阈值的句对索引对应的标题及段落内容作为句对索引结果,将待回答问题去除停用词,利用召回算法从全文索引中检索,获得全文索引结果,最后将段落索引结果、句对索引结果和全文索引结果按照预设策略整合,得到答案和参考答案。本发明能够快速从文档中获得答案,或者定位与问题有相关度的文本内容,提升非结构化文档问答的速度与精度。

    非结构化文档问答的方法、装置、存储介质和设备

    公开(公告)号:CN115828893A

    公开(公告)日:2023-03-21

    申请号:CN202211501006.8

    申请日:2022-11-28

    Abstract: 本发明提供一种非结构化文档问答的方法、装置、存储介质和设备,所述方法包括:创建文档索引库,对文档进行解析,获得段落索引、句对索引和全文索引,利用召回算法从段落索引中获得最相关段落并进行答案抽取,获得段落索引结果,对待回答问题和句对索引分别进行向量化处理并计算相似度得分,将相似度得分记录大于阈值的句对索引对应的标题及段落内容作为句对索引结果,将待回答问题去除停用词,利用召回算法从全文索引中检索,获得全文索引结果,最后将段落索引结果、句对索引结果和全文索引结果按照预设策略整合,得到答案和参考答案。本发明能够快速从文档中获得答案,或者定位与问题有相关度的文本内容,提升非结构化文档问答的速度与精度。

    一种面向大规模语言模型的深度学习模型训练方法及系统

    公开(公告)号:CN116644794A

    公开(公告)日:2023-08-25

    申请号:CN202310487657.4

    申请日:2023-05-04

    Abstract: 本发明提供一种面向大规模语言模型的深度学习模型训练方法及系统。所述面向大规模语言模型的深度学习模型训练方法,包括以下步骤:S1、将面向大规模语言模型的有关训练数据导入到文件服务器中,训练服务器中预安装训练环境;S2、在显示有控制界面的显示终端进行预测试,并得出预测试成绩。本发明提供的面向大规模语言模型的深度学习模型训练方法,在学习过程中,通过进行预测试,并根据预测试成绩,训练服务器能够从文件服务器中调用预先导入在所述文件服务器中的训练数据,生成对应的训练模型,从而对于有一些基础的而又没有学习数据的学者,能够使其快速对应学习,不仅提高了适用性,而且降低了学习语言的用时,从而提高了学习语言的效率。

    智能问答方法、装置、存储介质和设备

    公开(公告)号:CN116401345A

    公开(公告)日:2023-07-07

    申请号:CN202310219193.9

    申请日:2023-03-09

    Abstract: 本发明实施例提供一种智能问答方法、装置、存储介质和设备,该方法包括:对多个文档数据进行预处理,获得无标注训练数据、文档段落集和文档片段集,利用无标注训练数据对预训练模型进行继续训练,针对待回答问题,使用召回算法对文档段落集和文档片段集进行粗召回,获得候选段落和候选片段,并对候选片段进行后处理,将待回答问题依次与每一条候选段落和后处理后的候选片段进行拼接,获得多条待预测数据,将多条待预测数据输入继续训练好的模型中,获取输入文本向量特征,将输入文本向量特征输入答案抽取层获得所述待回答问题对应的答案。本发明能够提高问答效率和准确率,且能够支持跨段落的待回答问题。

Patent Agency Ranking