基于开放域信息抽取的人物行为抽取方法

    公开(公告)号:CN111061832A

    公开(公告)日:2020-04-24

    申请号:CN201911236862.3

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取技术领域,具体涉及基于开放域信息抽取的人物行为抽取方法,包括步骤:a、使用CoreNLP工具的Open IE功能生成三元组,三元组对应有元素,元素包括主语、谓语、宾语、时间、地点、间接宾语和其他;其中,t的下标代表三元组的分组号,t的上标代表三元组在组内的序号;b、将表示同一元素的三元组聚合到一起形成分组;c、从分组后的三元组中获取最佳三元组代表其描述的元素;d、将剩余的三元组进行二次分组;e、将三元组的宾语进行分类;f、构建行为链。与现有技术相比,本发明能比较准确的识别出相应的行为元素,并且,使用人物行为抽取能够有效提高文本的利用率,发现更多的人物、机构、地点之间的互动关系。

    基于物理距离和语义距离的双向LSTM模型的构建方法

    公开(公告)号:CN111027695A

    公开(公告)日:2020-04-17

    申请号:CN201911235589.2

    申请日:2019-12-05

    Abstract: 本发明属于计算机技术领域,具体涉及基于物理距离和语义距离的双向LSTM模型的构建方法,包括以下步骤:a、进行数据预处理;b、对LSTM模型中的单词进行向量化处理并对其物理特征和语义特征进行设置;c、构建双向LSTM模型。与现有技术相比,本发明可以有效地在LSTM网络的输入上增加物理特征和语义特征,在特征选择上,不仅仅使用词向量作为特征,更实将位置特征添加进来,将模型的训练集从句子级别细化到了实体对级别;模型构建上,也考虑到了语义上的句法以来,既充分考虑到了两个实体之间的最直接语义特征,降低上下文长度,又考虑到了非最短路径上的词语对分类结果的影响,有效提高了准确率。

    一种基于知识驱动的查询的实体链接方法

    公开(公告)号:CN110888946A

    公开(公告)日:2020-03-17

    申请号:CN201911236844.5

    申请日:2019-12-05

    Abstract: 本发明属于实体链接的技术领域,具体涉及一种基于知识驱动的查询的实体链接方法,包括如下步骤,步骤一、基于句法分析,识别用户查询语句中的命名性实体指称项;步骤二、基于增量证据挖掘,通过外部知识源,对所述实体指称项和本地知识库进行信息扩展;步骤三、采用推理链接算法,对所述实体指称项进行链接处理。本发明能够解决用户查询语句的语境缺乏和描述不规范等问题,并降低对本地知识库的依赖性,还准确实现候选实体的产生和判别,从而提高实体链接的性能。

    一种基于句法模式和机器学习的开放式关系的抽取方法

    公开(公告)号:CN111027324A

    公开(公告)日:2020-04-17

    申请号:CN201911235614.7

    申请日:2019-12-05

    Abstract: 本发明属于关系抽取的技术领域,具体涉及一种基于句法模式和机器学习的开放式关系的抽取方法,包括如下步骤,步骤一、对输入文本进行预处理,然后从所述输入文本中抽取实体和关系指示词,并组合为关系三元组格式,获取实体关系三元组候选集;步骤二、基于正负例判别算法,采用词向量模型和同义词林,通过计算句法模式之间的语义相似度,对关系候选集中每个三元组进行正负例判断,给出相应标签,自动生成所需的训练语料;步骤三、融入浅层和深层的文本特征,训练一个SVM分类器,对实体关系三元组进行区分和辨别。本发明能够对关系元组进行正负例判别,降低错误的句法分析对抽取关系元组带来的影响,有助于提高关系抽取的准确性。

    一种基于Bi-LSTM网络的无监督属性的抽取方法

    公开(公告)号:CN111026878A

    公开(公告)日:2020-04-17

    申请号:CN201911236864.2

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取的技术领域,具体涉及一种基于Bi-LSTM网络的无监督属性的抽取方法,包括:步骤一,生成向量集,使向量集中的每个向量的长度相等,将向量集中的每个向量输入Bi-LSTM网络;步骤二,Bi-LSTM网络对每个向量提取所需的信息,然后通过设置筛选词的方式对所需的信息进行过滤;步骤三,过滤后的信息经softmax函数输出,获得并标注所需要抽取的实体关系。本发明的Bi-LSTM网络主动地对输入的每个向量进行训练和标注,从而实现无监督地捕获和抽取所需的信息,有利于实现特征的自主学习和实体关系的高效抽取。

    基于概率软逻辑的知识验证模型构建与分析方法

    公开(公告)号:CN111026877A

    公开(公告)日:2020-04-17

    申请号:CN201911236858.7

    申请日:2019-12-05

    Abstract: 本发明属于信息抽取技术领域,具体涉及基于概率软逻辑的知识验证模型构建与分析方法,包括以下步骤:a、将信息抽取系统从多个数据源的网页web文本中抽取的知识组成候选知识集;b、对候选知识集进行可信度计算;c、将候选知识集中的每一个实体进行逻辑谓词表示;d、分别基于实体解析和本体约束构建知识验证模型的一阶逻辑规则,通过已构建的逻辑规则生成概率软逻辑模型中的一阶逻辑规则,实现候选知识集中实体关系、实体标签验证;e、设置知识验证模型的概率分布并通过推理算法计算选取相应的只是作为待更新的知识。本发明通过对候选知识集验证,使得候选知识集准确度得到了大幅的提高。

    一种答案质量的评估方法
    17.
    发明公开

    公开(公告)号:CN111026854A

    公开(公告)日:2020-04-17

    申请号:CN201911236857.2

    申请日:2019-12-05

    Abstract: 本发明属于自动应答的技术领域,具体涉及一种答案质量的评估方法,包括如下步骤,步骤一、采用BLSTM模型,对问答对的文本特征进行评估;步骤二、抽取若干个非文本特征,对所述问答对的非文本特征进行评估;步骤三、综合所述文本特征的评估和所述非文本特征的评估,然后将候选答案的综合得分从高到低进行排序,最后从所述候选答案中选择出最佳答案。本发明通过结合问答对的文本和非文本的特征以评估答案质量,有助于提高问题和答案的匹配度,从而提高答案的质量。

    一种基于概率软逻辑模型的实体解析方法

    公开(公告)号:CN110991186A

    公开(公告)日:2020-04-10

    申请号:CN201911235517.8

    申请日:2019-12-05

    Abstract: 本发明属于实体解析技术领域,具体涉及一种基于概率软逻辑模型的实体解析方法,包括以下步骤:a、将实体解析中的实体属性、实体关系以及本体约束分别进行逻辑谓词表示;b、分别基于实体属性、实体关系以及本体约束构建实体解析过程中的一阶逻辑规则;c、结合步骤a中声明的逻辑谓词与步骤b中构建的逻辑规则设置一个关于实体解析的概率软逻辑模型;d、对概率软逻辑模型进行权重学习;e、使用推理算法对概率软逻辑模型进行计算,通过实体解析概率值。与现有技术相比,本发明通过进行谓词逻辑表示,提出基于实体属性相似度、实体关系、本体约束的逻辑规则构建,实现了概率软逻辑模型的实体解析过程,有效地提高了实体解析的准确率与执行效率。

Patent Agency Ranking