一种基于Bi-LSTM网络的无监督属性的抽取方法

    公开(公告)号:CN111026878A

    公开(公告)日:2020-04-17

    申请号:CN201911236864.2

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于Bi-LSTM网络的无监督属性的抽取方法,包括:步骤一,生成向量集,使向量集中的每个向量的长度相等,将向量集中的每个向量输入Bi-LSTM网络;步骤二,Bi-LSTM网络对每个向量提取所需的信息,然后通过设置筛选词的方式对所需的信息进行过滤;步骤三,过滤后的信息经softmax函数输出,获得并标注所需要抽取的实体关系。本发明的Bi-LSTM网络主动地对输入的每个向量进行训练和标注,从而实现无监督地捕获和抽取所需的信息,有利于实现特征的自主学习和实体关系的高效抽取。

    一种答案质量的评估方法

    公开(公告)号:CN111026854A

    公开(公告)日:2020-04-17

    申请号:CN201911236857.2

    申请日:2019-12-05

    Abstract: 本发明属于自动应答的技术领域,具体涉及一种答案质量的评估方法,包括如下步骤,步骤一、采用BLSTM模型,对问答对的文本特征进行评估;步骤二、抽取若干个非文本特征,对所述问答对的非文本特征进行评估;步骤三、综合所述文本特征的评估和所述非文本特征的评估,然后将候选答案的综合得分从高到低进行排序,最后从所述候选答案中选择出最佳答案。本发明通过结合问答对的文本和非文本的特征以评估答案质量,有助于提高问题和答案的匹配度,从而提高答案的质量。

    一种基于知识图谱查询的并行抽取方法

    公开(公告)号:CN111091003A

    公开(公告)日:2020-05-01

    申请号:CN201911235588.8

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于知识图谱查询的并行抽取方法,包括:步骤一,提取数据源的URL,获取对应的文本页面;步骤二,对文本页面的内容进行过滤和分词处理,然后在预设的多个规则块中并行地运行信息匹配,对文本页面抽取所需要的实体关系;步骤三,汇总多个规则块的匹配结果,输出对文本页面的抽取结果。本发明的抽取方法可以应用于单文本和多文本的语句,多个规则块能够同时运行、并行地实施所需的匹配,有效地实现了单文本或者多文本中不同的语句的多级并行处理,从而减少了硬件成本和提升了匹配的速度。

    一种基于知识图谱查询的并行抽取方法

    公开(公告)号:CN111091003B

    公开(公告)日:2023-10-10

    申请号:CN201911235588.8

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于知识图谱查询的并行抽取方法,包括:步骤一,提取数据源的URL,获取对应的文本页面;步骤二,对文本页面的内容进行过滤和分词处理,然后在预设的多个规则块中并行地运行信息匹配,对文本页面抽取所需要的实体关系;步骤三,汇总多个规则块的匹配结果,输出对文本页面的抽取结果。本发明的抽取方法可以应用于单文本和多文本的语句,多个规则块能够同时运行、并行地实施所需的匹配,有效地实现了单文本或者多文本中不同的语句的多级并行处理,从而减少了硬件成本和提升了匹配的速度。

Patent Agency Ranking