基于本体增强和特征融合的知识图谱实体对齐方法及装置

    公开(公告)号:CN119808921A

    公开(公告)日:2025-04-11

    申请号:CN202411936764.1

    申请日:2024-12-26

    Inventor: 王石 宋浩 资康莉

    Abstract: 本发明提出一种基于本体增强和特征融合的知识图谱实体对齐方法和装置,包括:获取待实体对齐的多个知识图谱;通过本体增强编码器将知识知识图谱引入本体信息,得到增强图谱;结构编码器提取增强图谱的结构信息,得到知识图谱的结构特征;通过关系编码器提取知识图谱的关系信息,得到关系特征;通过属性编码器器提取知识图谱的属性信息,生成属性特征;通过实体名称编码器,将知识图谱的实体名称信息进行提取,生成实体名称特征;对上述特征向量和实体名称特征分别进行动态特征加权后,进行特征融合形成统一实体向量表示,通过自适应对比学习的方法对形成统一的实体向量进行实体对齐,得到多个知识图谱的实体对齐知识图谱,作为实体对齐结果。

    一种客户化知识智能系统

    公开(公告)号:CN102147792B

    公开(公告)日:2012-11-21

    申请号:CN201010110386.3

    申请日:2010-02-09

    Abstract: 本发明提供一种客户化知识智能系统,其特征在于自然语言理解准确率高、系统反应速度快、容错性好、设计人性化等,主要包括:NLP模块,用于对客户的短信咨询进行文本识别,从中得出咨询信息,所述咨询信息包括客户咨询的业务名称、主题和摘要;咨询分发模块,用于把咨询分配给各个话务员;知识库缓存模块,用于存放知识库内容,所述知识库内容包括业务名称、主题和摘要,以及与上述三者相对应的答案;以及话务员模块,用于接受话务员登陆,并为话务员提供显示接口和控制接口;同时还用于调用知识库缓存模块得出对应于咨询信息的答案以供话务员使用。本发明能够极大地提高咨询业务处理效率,缩短咨询回复时间,减少客服资源浪费。

    一种支持客户和业务多样性的应答管理方法及其系统

    公开(公告)号:CN102376014A

    公开(公告)日:2012-03-14

    申请号:CN201010250006.6

    申请日:2010-08-10

    Abstract: 本发明有关于一种支持客户和业务多样性的应答管理方法及其系统,其中该方法包括:步骤1,维护应答时效层,选择应答的有效时段;步骤2,维护客户群层,选择应答所属的客户群类别;步骤3,维护电子渠道层,选择应答的电子渠道;步骤4,维护业务指令,选择应答与业务指令的相关性;步骤5,维护环境标签,选择应答的业务服务状态;步骤6,维护地域标签,选择应答的有效区域;步骤7,对参数模板进行维护;步骤8,维护应答内容层,选择应答的形态,并利用所述参数模板对应答内容进行维护。采用本发明方法实现了多层次、多标签、多形态的应答管理,方便应答管理员快速地维护、查询应答,节省了维护应答的时间,降低了维护应答的成本。

    一种基于大模型知识蒸馏的文档级事件抽取方法及装置

    公开(公告)号:CN119962515A

    公开(公告)日:2025-05-09

    申请号:CN202510034936.4

    申请日:2025-01-09

    Abstract: 本发明提出一种基于大模型知识蒸馏的文档级事件抽取方法,包括:构建训练文档的事件本体信息;基于事件本体信息和大语言模型,构建训练文档的包含上下文信息的事件抽取问题;获取与事件抽取问题匹配的强相关片段;以教师模型基于该强相关片段生成软标签,以软标签构建软标签数据集;构建问答模型,以软标签数据集训练问答模型;以完成训练的问答模型,对目标文档进行事件抽取操作。本发明还提出一种基于大模型知识蒸馏的文档级事件抽取装置。本发明提供一种文档级事件抽取的方法,利用预训练大模型的知识,将其在长文本和复杂事件处理方面的丰富信息迁移到较小的问答模型中,在较少标注数据的情况下,提高事件识别和论元提取的准确率。

    实体关系抽取方法、装置、设备、介质及程序产品

    公开(公告)号:CN119691090A

    公开(公告)日:2025-03-25

    申请号:CN202411849332.7

    申请日:2024-12-16

    Abstract: 本发明提出一种实体关系抽取方法、装置、设备、介质及程序产品,该方法包括如下步骤:依据给定实体对或者给定关系通过大语言模型生成非结构化文本;将所述非结构化文本添加至实体关系联合抽取模型的初始训练集,得到目标训练集;利用所述目标训练集对所述实体关系联合抽取模型进行训练;对获取的目标文本进行编码处理,得到所述目标文本的特征向量;基于训练好的所述实体关系联合抽取模型,结合所述特征向量对所述目标文本进行实体关系抽取,得到所述目标文本的三元组。该方法提高了实体关系联合抽取模型的可泛化能力和鲁棒性,提高了文本的实体关系抽取的有效性。

    一种单字错别字识别模型的训练方法及其训练集生成方法

    公开(公告)号:CN114266244A

    公开(公告)日:2022-04-01

    申请号:CN202111610175.0

    申请日:2021-12-27

    Inventor: 曹阳 曹存根 王石

    Abstract: 本发明提供一种生成用于单字错别字识别模型的训练集的方法,包括:S1、获取语料库,对语料库中的各语句进行分词处理和词性标注,得到多个原始分词序列,每个原始分词序列包括多个分词项以及每个分词项的词性;S2、基于原始分词序列构建各分词项的标签,得到标签序列,其中初始的标签值指示每个分词项对应的文字是正确文字;S3、将相应原始分词序列中一个为单字的分词项替换为与相应单字相似的错误单字,得到带错字分词序列,并更改相应标签序列中单字被替换的分词项对应的标签值以指示其对应的单字为错误文字;S4、重复步骤S3,构建包括多个样本的训练集,每个样本包括分词序列及对应的标签序列,分词序列为原始分词序列或者带错字分词序列。

    一种服务智能导航方法和系统

    公开(公告)号:CN101499277B

    公开(公告)日:2011-05-04

    申请号:CN200810117244.2

    申请日:2008-07-25

    Abstract: 本发明提供一种服务智能导航方法,包括:对用户所提出查询语句的分词结果进行基于元数据的文法匹配;根据分词结果找出相匹配的词模模式,得到所述相匹配的词模模式所在的服务分类;将分词结果与描述性信息或业务性信息进行匹配查找,得到第一候选服务分类列表;对只有一个候选服务分类的第一候选服务分类列表,从唯一的候选服务分类中获取服务并返回给用户,若候选服务分类大于或等于两个,则对查询语句中的未登录串进行模糊理解,得到第二候选服务分类列表;根据第一候选服务分类列表与第二候选服务分类列表作融合操作,得到公共的候选服务分类,若其唯一,则返回服务给用户,若所述公共的候选服务分类不存在或多于一个,则导航失败。

    一种移动客服知识库系统及其工作方法

    公开(公告)号:CN101650797A

    公开(公告)日:2010-02-17

    申请号:CN200910092088.3

    申请日:2009-09-14

    Abstract: 本发明公开了一种移动客服知识库系统及其工作方法。该系统包括登录模块,用于验证登录信息,在系统用户通过身份验证后,进入移动客服知识库系统;还包括:管理维度选择模块,用于选择预查看业务所在的管理维度;业务加载模块,用于根据所述选择的管理维度进入不同入口,加载不同的业务树,并呈树状结构显示;业务数据管理模块,用于知识库编辑人员对与业务相关的数据进行管理;句型管理模块,用于实现对与问题相关的句型进行管理;答案管理模块,用于将知识库编辑人员编辑的答案按照预设的层次进行自动归类和管理。其通过定义知识库中知识的结构,方便系统用户维护、查询并支持自然语言解析功能。

    一种信息处理的方法及电子设备

    公开(公告)号:CN104714938B

    公开(公告)日:2017-12-29

    申请号:CN201310683961.2

    申请日:2013-12-12

    Abstract: 本发明公开了一种信息处理方法,应用于一电子设备中,所述电子设备能够获得一垃圾信息样本数据库,当所述电子设备接收到一信息时,所述方法包括:通过第一预定规则判断所述信息是否为垃圾信息;当通过所述第一预定规则判断所述信息不是垃圾信息时,将所述信息与所述垃圾信息样本数据库中的垃圾信息样本进行匹配,判断匹配结果是否满足第二预定规则;当匹配不成功时,通过第三预定规则判断所述信息是否为垃圾信息。通过该方法,消除了现有技术中垃圾信息过滤精度有限的技术问题,实现了提高垃圾信息过滤准确性的技术效果。

Patent Agency Ranking