-
公开(公告)号:CN114461764A
公开(公告)日:2022-05-10
申请号:CN202011229720.7
申请日:2020-11-06
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/335 , G06F16/35 , G06F16/36 , G06F16/951 , G06F40/284 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明是一种基于文本蕴含的多源答案校验方法。本发明涉及复杂智能问答系统环境技术领域,本发明通过基于文本蕴含的答案校验模块,在整个问答项目中处于下游位置,用来作为收尾,根据前期多意图识别及问答模块,针对一个问题输入得到多个不同来源的答案,通过答案校验模块对返回给用户具体回答进行筛选。本发明是基于文本蕴含的多源答案校验技术。原生性地适合于任何的问答系统。本发明使用的训练任务不是由单一的基于阅读理解的问答系统提出的不够完备的训练集所确定,而是使用了一种比较开放的通用文本理解任务,即文本蕴含识别任务。通过这样的方式,能够很轻松地训练出能够校验所有问答系统的,训练集便于获取也足够完备的答案校验系统。
-
公开(公告)号:CN112749265A
公开(公告)日:2021-05-04
申请号:CN202110025105.2
申请日:2021-01-08
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/35 , G06F40/295 , G06N3/08 , G06N3/04
Abstract: 本发明提出了一种基于多信息源的智能问答系统,所述系统具体包括基于知识库的问答模块KBQA、基于文档集的问答模块DBQA、基于常问问题集的问答模块QuesSimQA、第三方API模块和多元答案验证模块;对于用户的问题,所述KBQA模块、DBQA模块、QuesSimQA模块和第三方API模块分别给出一个答案,再通过多源答案验证模块对各个模块提供的答案进行验证打分排序,将得分最高的答案提交给用户;解决了知识库和常问问题集大小有限的问题,还解决了基于文档集的问答系统不易于支持复杂推理和网页文本质量较差的问题。
-
公开(公告)号:CN112883708A
公开(公告)日:2021-06-01
申请号:CN202110210878.8
申请日:2021-02-25
Applicant: 哈尔滨工业大学
IPC: G06F40/205 , G06F40/284 , G06K9/62 , G06N3/04 , G06N5/04
Abstract: 本发明公开了基于2D‑LSTM的文本蕴含识别方法,属于文本识别技术领域。文本蕴含识别方法包括以下步骤:步骤一、选择两个句子,利用按照两个句子的长短构建一个二维的大小为S*T的网格;步骤二、从左到右、从上到下依次计算每个单元格的记忆向量;步骤三、当计算到网格的右下角的单元格时,以把两个句子中的每个词与对方句子中的每个词进行两两比较,得到比较信息;步骤四、在右下角的单元格中保存比较信息;步骤五、利用比较信息建模两个句子之间的相似程度。而本发明对于目前主流模型的缺陷,都进行了一定程度的规避,同时对其优势,也进行了一定程度地继承。
-
公开(公告)号:CN112749265B
公开(公告)日:2022-08-19
申请号:CN202110025105.2
申请日:2021-01-08
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/35 , G06F40/295 , G06N3/08 , G06N3/04
Abstract: 本发明提出了一种基于多信息源的智能问答系统,所述系统具体包括基于知识库的问答模块KBQA、基于文档集的问答模块DBQA、基于常问问题集的问答模块QuesSimQA、第三方API模块和多元答案验证模块;对于用户的问题,所述KBQA模块、DBQA模块、QuesSimQA模块和第三方API模块分别给出一个答案,再通过多源答案验证模块对各个模块提供的答案进行验证打分排序,将得分最高的答案提交给用户;解决了知识库和常问问题集大小有限的问题,还解决了基于文档集的问答系统不易于支持复杂推理和网页文本质量较差的问题。
-
-
-