一种数据的检索方法、装置及设备

    公开(公告)号:CN117312492A

    公开(公告)日:2023-12-29

    申请号:CN202311141896.0

    申请日:2023-09-05

    Abstract: 本说明书实施例公开了一种数据的检索方法、装置及设备,该方法包括:获取目标事件的查询请求,查询请求中包括目标事件的事件文本,获取针对查询请求的历史事件文书集,对事件文本进行关键信息提取,得到事件文本对应的事件信息,事件信息包括目标事件的事件触发词,对事件信息和事件文本进行编码处理,得到第一编码信息,并对第一编码信息中事件触发词对应的编码信息进行池化处理,得到第二编码信息,对历史事件文书进行编码处理,得到第三编码信息集,基于预先训练的表征模型对第二编码信息和第三编码信息集进行处理,并基于处理后的第二编码信息和第三编码信息集,从历史事件文书集中确定查询到的与目标事件相匹配的历史事件文书。

    文本生成模型的强化学习训练方法、文本生成方法及系统

    公开(公告)号:CN118469037A

    公开(公告)日:2024-08-09

    申请号:CN202410595062.5

    申请日:2024-05-14

    Abstract: 本说明书提供一种文本生成模型的强化学习训练方法、文本生成方法及系统,该方法包括:基于多个输入文本中的每个输入文本,在预训练语言模型的基础上得到多个生成文本;基于预先构建的知识图谱对多个生成文本进行打分,得到多个反馈分数;基于多个反馈分数,从多个生成文本中选择文本进行组合,得到每个输入文本对应的至少一个正负样本对,至少一个正负样本对中的每个正负样本对包括一个作为正样本的生成文本和一个作为负样本的生成文本,且作为正样本的生成文本的反馈分数高于作为负样本的生成文本的反馈分数;以及基于多个输入文本和每个输入文本对应的至少一个正负样本对,对预训练语言模型进行强化学习训练,得到文本生成模型。

    事件抽取方法、装置、计算机程序产品、存储介质及设备

    公开(公告)号:CN115048486B

    公开(公告)日:2024-05-31

    申请号:CN202210580427.8

    申请日:2022-05-24

    Abstract: 本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。

    统一信息抽取方法和装置
    6.
    发明公开

    公开(公告)号:CN117113998A

    公开(公告)日:2023-11-24

    申请号:CN202311076249.6

    申请日:2023-08-24

    Abstract: 本说明书实施例提供一种统一信息抽取方法和装置,方法包括:获取目标文本及信息抽取任务对应的提示词序列;提示词序列包括指示任务类型的第一提示词,及指示待提取的要素类型的第二提示词;将各提示词,及目标文本中的各字分别作为单个输入单元输入预先训练的编码器,得到各输入单元分别对应的初始嵌入向量;利用注意力处理模型,基于各初始嵌入向量确定各个字与提示词序列之间的注意力,基于注意力和各初始嵌入向量得到各输入单元分别对应的二次嵌入向量;利用关系处理模型,根据各二次嵌入向量,确定相关性矩阵,至少包括第一关系矩阵和第二关系矩阵;基于第一关系矩阵确定抽取要素的边界,基于第二关系矩阵确定抽取要素的要素类型。

    知识查询推理方法及装置、知识库系统

    公开(公告)号:CN118940845A

    公开(公告)日:2024-11-12

    申请号:CN202411419984.7

    申请日:2024-10-11

    Abstract: 本说明书提供一种知识查询推理方法及装置、知识库系统,方法包括根据用户查询短语对知识图谱上的关联节点进行检索,并在根据关联节点未检索到查询结果的情况下,从知识图谱中获取与关联节点对应的文本信息,文本信息用于描述节点对应的事实知识,根据文本信息以及用户查询短语调用大语言模型生成查询结果。通过知识图谱中结构化知识与文本知识的融合表示,可以避免知识图谱过渡结构化带来的维度灾难和难以维护问题,降低成本和图谱复杂性,文本知识可以弥补结构化知识的上下文信息缺失问题;而且知识图谱中文本知识也可以弥补大语言模型的事实知识缺失问题,实现大语言模型与知识图谱性能的双向增强。

    一种文本事件关系提取方法、装置

    公开(公告)号:CN118917405A

    公开(公告)日:2024-11-08

    申请号:CN202410917317.5

    申请日:2024-07-09

    Abstract: 一种文本事件关系提取方法,包括:获取用于进行事件关系提取的数据样本;其中,所述数据样本包含文本、以及用于指示从所述文本中提取至少一个目标文本事件的指令;所述目标文本事件为与指定的文本事件具有目标类型的文本事件关系的文本事件;所述目标类型的文本事件关系为从多种类型的文本事件关系中指定的文本事件关系类型;将所述数据样本输入至LLM模型,以由所述LLM模型响应于所述指令,针对所述文本进行逻辑推理,从所述文本包含的文本事件中选择出所述至少一个目标文本事件,以完成针对所述文本的事件关系提取。

    构建产业链知识图谱的方法和装置

    公开(公告)号:CN117540031A

    公开(公告)日:2024-02-09

    申请号:CN202311553517.9

    申请日:2023-11-20

    Abstract: 本说明书实施例提供了一种构建产业链知识图谱的方法和装置。该方法的一具体实施方式包括:从原始数据中提取品类相关数据,其中包括品类词库,以及与品类相关的关系三元组;基于品类相关数据,生成品类体系子图、品类生产关系子图和企业品类关系子图;品类体系子图中的节点表示品类,边表示品类之间的上下位关系;品类生产关系子图中的节点表示品类,边表示品类之间在产业链上的上下游关系;企业品类关系子图中的节点表示企业和品类,边表示企业与品类之间的关联关系;对品类体系子图和/或品类生产关系子图进行逻辑验证,根据验证结果调整对应子图中的边;将企业品类关系子图,以及调整后的品类体系子图和品类关系子图进行融合,得到产业链知识图谱。

Patent Agency Ranking