-
公开(公告)号:CN113761151B
公开(公告)日:2024-12-03
申请号:CN202110496948.0
申请日:2021-05-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F16/36 , G06F40/247 , G06F40/30
Abstract: 本申请涉及一种同义词挖掘方法、装置、计算机设备和存储介质。所述方法包括:获取待挖掘词和候选基础同义词集;计算待挖掘词与基础同义词的编辑距离,并计算基础同义词之间的编辑距离,得到各个词距离特征;将待挖掘词和基础同义词分别进行向量化,得到各个词向量特征,提取待挖掘词和基础同义词的知识表征,得到各个词知识特征;将待挖掘词和基础同义词对应的词距离特征、词向量特征和词知识特征进行融合,得到词目标特征;基于待挖掘词对应的词目标特征和基础同义词对应的词目标特征计算待挖掘词与候选基础同义词集的同义程度;基于同义程度确定目标基础同义词集,将待挖掘词新增至目标基础同义词集。采用本方法能够提高同义词挖掘的准确性。
-
公开(公告)号:CN116756554B
公开(公告)日:2024-10-01
申请号:CN202210208340.8
申请日:2022-03-04
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F18/214 , G06F18/213 , G06N5/025 , G06N20/00 , G06F17/18
Abstract: 本申请公开了一种对齐模型的训练方法、装置、设备、介质及程序产品,涉及机器学习领域。该方法包括:获取至少两个样本知识图谱,样本知识图谱中的节点对应包括第一模态数据和第二模态数据;获取第一模态数据对应的第一模态特征表示;获取第二模态数据对应的第二模态特征表示;在模态内对第一模态特征表示进行对比分析,对第二模态特征表示进行对比分析,得到模态内损失;在模态间对第一模态特征表示和第二模态特征表示进行对齐分析,得到模态间损失;以模态内损失和模态间损失对对齐模型进行训练,得到目标对齐模型。通过以上方式,利用模态内和模态间的交互关系,提高对齐模型的训练效果。本申请可应用于云技术、人工智能、智慧交通等各种场景。
-
公开(公告)号:CN118656479A
公开(公告)日:2024-09-17
申请号:CN202411136208.6
申请日:2024-08-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/295 , G06F40/242 , G06N3/0455 , G06N5/04
Abstract: 本申请提供一种基于大模型的文本处理方法、装置、设备、介质及产品,涉及人工智能、大语言模型等技术领域。通过基于待处理文本,采用通用大模型进行实体单元识别得到第一概率分布,采用识别大模型进行实体单元识别得到第二概率分布,基于所述第一概率分布和第二概率分布,获得所述待处理文本中的目标实体单元。且基于待处理文本和目标实体单元,采用通用大模型对目标实体单元进行分类得到第三概率分布,采用分类大模型进行分类得到第四概率分布,并基于第三概率分布和第四概率分布获得目标类别;通过将抽取分解为识别和分类,不同流程轮换利用不同大模型的能力,可提高抽取结果的准确性。
-
公开(公告)号:CN113609233B
公开(公告)日:2024-09-03
申请号:CN202110144797.2
申请日:2021-02-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/28 , G06F40/295 , G06F40/30
Abstract: 本申请涉及计算机技术领域,尤其涉及一种实体对象编码方法、装置、电子设备和存储介质,用以提高实体对象编码的准确性。其中,方法包括:获取待编码知识图谱中的各个实体对象;分别对各个实体对象进行编码,获得对应的实体嵌入特征,以及分别对各个实体对象的实体类别进行编码,获得对应的类别嵌入特征,其中,各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的;分别将各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合,获得各个实体对象对应的实体编码信息。本申请借助用于表示实体类别的本体知识,为数据量较少的实体对象进行指导,从而克服其误差,提升实体对象的编码质量,提高实体对象编码的准确度。
-
公开(公告)号:CN116976439B
公开(公告)日:2024-01-05
申请号:CN202311227004.9
申请日:2023-09-22
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及人工智能领域,提供了一种模型矛盾现象的识别方法、装置、设备及存储介质。该方法包括:获得包含多个肯定知识三元组的知识图谱,基于知识图谱中与各头实体具有相同类型的第一头实体集及其关联的实体关系,生成实体间不具有相应实体关系的各否定知识三元组,以及,生成不具有相应实体关系的各否定知识三元组;通过明确定义的否定知识三元组与模糊定义的否定知识三元组,对目标模型进行矛盾现象的识别判定,扩大了矛盾现象的识别范围,尽可能识别出目标模型对模糊定义否定知识的认知是否一致,避免目标模型应用于实际应用场景时,出现矛盾现象,从而提升模型在问答过程中的作答准确率以及产品使用对象的使用体验。
-
公开(公告)号:CN117149982A
公开(公告)日:2023-12-01
申请号:CN202311408403.5
申请日:2023-10-27
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/335 , G06F40/126 , G06F40/166
Abstract: 本申请提供了一种基于人工智能的问答处理方法、装置、设备及存储介质;方法包括:接收被输入的问题文本;获取多个问答模型针对所述问题文本分别输出的回答文本;对所述问题文本以及多个所述回答文本分别进行编码,对应得到所述问题文本的特征向量、以及每个所述回答文本的特征向量;将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行融合,对应得到多个融合向量;确定所述多个融合向量的重心;将与所述重心距离最近的融合向量对应的回答文本,作为最终输出的回答文本。通过本申请,能够以资源集约的方式提高智能问答服务的回答效果。
-
公开(公告)号:CN117131176A
公开(公告)日:2023-11-28
申请号:CN202311095222.1
申请日:2023-08-28
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/216 , G06F40/253
Abstract: 本申请实施例公开了一种交互式问答处理方法、装置、电子设备和存储介质;本申请实施例获取查询文本,以及多个预设关键词之间的关联关系,查询文本包括待查询关键词;基于多个预设关键词之间的关联关系和待查询关键词,从多个预设关键词中确定目标关键词;基于目标关键词与待查询关键词之间的关联关系,获取文本约束条件;根据文本约束条件和文本元素,生成查询文本关联的扩充文本,文本元素包括待查询关键词、目标关键词和待查询关键词与目标关键词之间的关联关系;对扩充文本与查询文本进行拼接处理,得到扩展查询文本,以获取扩展查询文本对应的答案。在本申请实施例中,可以提升了查询文本的查询范围,以便满足用户的查询需求。
-
公开(公告)号:CN116992037A
公开(公告)日:2023-11-03
申请号:CN202211216862.9
申请日:2022-09-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/36 , G06F16/31 , G06F16/33 , G06F16/332 , G06F16/338 , G06F40/295 , G16B50/00
Abstract: 本申请公开了一种多维知识图谱的构建方法、装置、设备及产品,应用于数据处理技术领域。该方法包括:获取至少两个生物医学数据库,所述生物医学数据库存储有不同实体和连接所述不同实体的实体关系;将所述至少两个生物医学数据库中的同类实体进行标准化,得到至少两个标准化实体;基于所述至少两个生物医学数据库中的不同实体之间的实体关系,重构不同所述标准化实体之间的实体关系;基于所述至少两个标准化实体和不同所述标准化实体之间的实体关系,构建所述多维知识图谱。该方法能够在整合数据库的基础上,以基因类实体为主,构建一个多维度的知识图谱。
-
公开(公告)号:CN116975304A
公开(公告)日:2023-10-31
申请号:CN202310402487.5
申请日:2023-04-11
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供了一种知识图谱纠错方法、装置、电子设备及计算机程序产品,涉及人工智能技术领域。包括:获取目标知识图谱中的知识三元组;获取各知识三元组对应的语义特征和预定义特征,预定义特征表征对应的知识三元组在目标知识图谱中的结构信息和对应的知识三元组的知识本体信息;对于每一知识三元组,通过目标无监督聚类模型调用知识三元组对应的语义特征和预定义特征,获取知识三元组对应的异常概率;基于各知识三元组的异常概率,确定异常知识三元组,并对异常知识三元组进行纠正。该方案中采用无监督聚类模型和各知识三元组的语义特征和预定义特征进行异常概率的预测,节省了目标知识图谱纠错的人工成本,提高了目标知识图谱纠错的准确性。
-
公开(公告)号:CN116956921A
公开(公告)日:2023-10-27
申请号:CN202310890635.2
申请日:2023-07-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/295 , G06F40/30 , G06F18/214 , G16H70/00
Abstract: 本发明实施例公开了一种医学文本信息的处理方法及装置、存储介质,通过获取医学文本信息,对所述医学文本信息进行成分分析,提取所述医学文本信息中的医学实体以及所述医学实体对应的成分类型,将提取的所述医学实体组成候选医学实体集合,对所述候选医学实体集合中各个不同的所述医学实体之间进行成分重组,确定成分重组后能够还原所述医学文本信息的目标组合,输出所述目标组合对应的所述医学实体以及所述医学实体的所述成分类型。由于目标组合中的各个医学实体能够重组还原所述医学文本信息,因此目标组合中的医学实体能够对原始的医学文本信息的医学含义进行准确的表达,能够提高医学术语标准化的准确性。
-
-
-
-
-
-
-
-
-