-
公开(公告)号:CN114817512A
公开(公告)日:2022-07-29
申请号:CN202210738644.5
申请日:2022-06-28
Applicant: 清华大学
IPC: G06F16/332 , G06F16/31 , G06F16/36
Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。
-
公开(公告)号:CN114661916A
公开(公告)日:2022-06-24
申请号:CN202210220916.2
申请日:2022-03-08
Applicant: 清华大学
IPC: G06F16/36
Abstract: 本发明提供一种三元组作为节点的知识图谱的表示学习方法、装置及设备,属于机器学习技术领域,方法通过初始化预测模型的参数,参数包括知识图谱中实体和关系的向量表示,知识图谱是三元组作为节点所构成的;遍历知识图谱中的每个三元组,确定预测模型针对每个三元组的损失;基于每个三元组的损失,利用优化器对实体和关系的向量表示进行优化,由于知识图谱本身是以三元组作为节点所构成的,该类型的知识图谱可以极大地丰富知识图谱的表示能力,且基于该知识图谱的表示学习方法,能够很好的对这类知识图谱进行表示学习。
-
公开(公告)号:CN113282720A
公开(公告)日:2021-08-20
申请号:CN202010126091.9
申请日:2020-02-20
Applicant: 清华大学
IPC: G06F16/332 , G06F16/583 , G06N5/04
Abstract: 本发明实施例提供一种视觉推理方法和装置,所述视觉推理方法包括:将待推理的图像解析为场景图;获取寻点模块、寻边模块、转移模块和逻辑模块;基于待解答的问题,确定与问题对应的模块序列,模块序列包括寻点模块、寻边模块、转移模块和逻辑模块中的至少部分的排列;将场景图按模块序列执行,确定推理结果。本发明的视觉推理方法,基于场景图来进行推理,且针对场景图的结构,设计了四种简单、高效、通用的元推理模块,可以大大减少参数量,并且可以通过组装这些元模块来得到功能更为复杂的模块,使得该推理方法的通用性强。
-
公开(公告)号:CN113282745B
公开(公告)日:2023-04-18
申请号:CN202010104947.2
申请日:2020-02-20
Applicant: 清华大学
IPC: G06F16/35 , G06F16/335 , G06F16/9535 , G06F40/216
Abstract: 本发明实施例提供一种事件百科文档自动生成方法和装置,所述事件百科文档自动生成方法包括:基于现存的与待处理事件同事件类别的百科文档,生成该事件类别的主题树,其中所述主题树包括多个主题;获取所述待处理事件的相关文档集合;基于所述相关文档集合和所述主题树,确定与多个所述主题分别对应的目标文本信息;根据与多个所述主题分别对应的所述目标文本信息,确定与多个所述主题分别对应的摘要;基于与多个所述主题分别对应的所述摘要,生成所述待处理事件的百科文档。本发明实施例的事件百科文档自动生成方法,可以对新事件自动生成包括多个主题的百科文档,使得生成的百科文档目录更完善,更细致地描述事件不同方面的重点信息。
-
公开(公告)号:CN114817510B
公开(公告)日:2022-10-14
申请号:CN202210715592.X
申请日:2022-06-23
Applicant: 清华大学
IPC: G06F16/332 , G06F40/186 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。
-
公开(公告)号:CN113282676A
公开(公告)日:2021-08-20
申请号:CN202010104948.7
申请日:2020-02-20
Applicant: 清华大学
Abstract: 本发明实施例提供一种知识库实体对齐方法和装置,所述方法包括使用图注意力神经模型将待对齐的至少两个知识库进行实体编码,获得注意力增强的实体向量表示,且所述注意力增强的实体向量表示融合了实体邻居信息;基于注意力增强的实体向量表示,使用知识库表示学习模型,获得用于约束所述实体向量表示的第一约束条件;基于预先确定的等价实体对集合,获得第二约束条件;基于所述第一约束条件和所述第二约束条件,实现所述至少两个知识库之间的实体对齐。本发明实施例提供的知识库实体对齐方法和装置,能充分地利用有限的预先对齐的实体对,很好地处理异构知识库之间的差异,提升实体对齐的效果。
-
公开(公告)号:CN115617954B
公开(公告)日:2023-03-28
申请号:CN202211440775.1
申请日:2022-11-17
Applicant: 清华大学
IPC: G06F16/33 , G06F16/332 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。
-
公开(公告)号:CN115617954A
公开(公告)日:2023-01-17
申请号:CN202211440775.1
申请日:2022-11-17
Applicant: 清华大学
IPC: G06F16/33 , G06F16/332 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、装置、电子设备及存储介质,其中方法包括:将问题输入生成模型,获得问题对应的推理程序;基于目标知识库执行问题对应的推理程序得到问题的答案;生成模型是基于目标知识库之外的外部知识库和对应的第一数据集,以及目标知识库和对应的第二数据集,进行训练得到的,第一数据集包括第一问题样本和对应的第一推理程序标签,第二数据集包括第二问题样本和对应的答案样本;生成模型用于通过解码程序的树形结构所转换的序列中每个位置的词汇得到问题对应的推理程序;或者,通过解析程序骨架以及程序骨架所需的参数得到问题对应的推理程序。解决平行语料缺失的问题,提升了问答性能。
-
公开(公告)号:CN114817510A
公开(公告)日:2022-07-29
申请号:CN202210715592.X
申请日:2022-06-23
Applicant: 清华大学
IPC: G06F16/332 , G06F40/186 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种问答方法、问答数据集生成方法及装置,方法包括:获取待回答问题,将待回答问题输入至问答模型,得到待回答问题的答案;问答模型是基于问答数据集得到的,针对提问策略库的每种问题模板,从提问对象库中选择与第一占位符对应的若干目标元素,基于元素描述策略库的M种元素描述模板生成目标元素的M个元素描述信息,将若干目标元素的M个元素描述信息依次替换问题模板中对应的第一占位符,生成多个第一问题;基于第一问题中具有别名的元素将第一问题转写成第二问题,并通过生成第二问题的释义将第二问题转写成第三问题;基于所有第三问题及目标元素生成问答数据集,解决了问答数据集的质量问题,提高了质量。
-
公开(公告)号:CN113297386A
公开(公告)日:2021-08-24
申请号:CN202010108590.5
申请日:2020-02-21
Applicant: 清华大学
Abstract: 本发明实施例提供一种限定领域的实体链接方法和装置,所述限定领域的实体链接方法包括:通过实体提及‑知识库实体字典,获取待链接文本中的实体提及和候选实体集;将获取的所述实体提及和候选实体集的全局特征和局部特征输入到实体消歧模型,获得所述实体消歧模型输出的所述候选实体集中的候选实体是所述实体提及指代的知识库实体的概率;根据所述候选实体集中的候选实体是所述实体提及指代的知识库实体的概率,确定待链接文本的实体链接。本发明实施例的限定领域的实体链接方法,可以免去人工标注工作,且链接准确率高。
-
-
-
-
-
-
-
-
-