-
公开(公告)号:CN112148883A
公开(公告)日:2020-12-29
申请号:CN201910583845.0
申请日:2019-06-29
IPC: G06F16/36
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN119293257A
公开(公告)日:2025-01-10
申请号:CN202411189770.5
申请日:2019-06-29
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN101030220A
公开(公告)日:2007-09-05
申请号:CN200710065197.7
申请日:2007-04-06
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本方法涉及一种基于可扩展标记语言文档树的连接方法,属于网络数据处理技术领域。首先设两棵可扩展标记语言文档树分别为T1 和T2 ,两棵树具有相同的根结点;将两棵文档树的结点和边分别合并,得到可扩展标记语言文档树T 。本发明方法的优点是,在合并结点和边的过程中,采用了普通的集合并运算,不仅是基于R树的空间连接运算,而且适合各种XML应用的需求。本方法使得可扩展标记语言文档数据的查询处理和关键字检索技术有了严格的数学理论的支持,保证了各种可扩展标记语言文档树的变换方法的正确性。
-
公开(公告)号:CN114298042B
公开(公告)日:2024-10-15
申请号:CN202111444208.9
申请日:2021-11-30
Applicant: 清华大学
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06N3/0895 , G06N3/0985 , G06N3/084 , G06N3/0455
Abstract: 本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。
-
公开(公告)号:CN112148883B
公开(公告)日:2024-09-10
申请号:CN201910583845.0
申请日:2019-06-29
IPC: G06F16/36
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN114265922A
公开(公告)日:2022-04-01
申请号:CN202111395477.0
申请日:2021-11-23
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F40/279
Abstract: 本发明提供一种基于跨语言的自动问答、模型训练方法及设备,其中的方法包括:获取问题和文本,文本的语言不同于问题的语言;将问题和文本输入至自动问答模型,得到自动问答模型输出的文本中问题的答案的位置信息;其中,自动问答模型是基于问题样本及包含问题样本的答案的文本样本,对包含知识增强的预训练模型的预设模型进行训练得到的,知识增强的预训练模型是基于利用知识图谱构建的多个多元组,对初始的预训练模型进行预训练得到的,能够学习到跨语言的知识以建立不同语言之间的对应关系,从而使得知识增强的预训练模型的推理能力和对不同语言的理解能力得到了增强,进而实现了自动问答模型对跨语言的问答的性能的提升。
-
公开(公告)号:CN103473542B
公开(公告)日:2017-01-11
申请号:CN201310422335.8
申请日:2013-09-16
Applicant: 清华大学
Abstract: 本发明提出一种多线索融合的目标跟踪方法,包括以下步骤:实时采集预定区域的图像,并将图像划分为多个子区域;选定待跟踪目标,对其在图像中的位置对应的子区域的模板集进行更新,并搜索该模板集的最佳匹配点;计算待跟踪目标和粒子滤波区域的分块颜色和边缘分布的外观特征;根据光流计算法估计待跟踪目标在图像中的整体运动矢量;对粒子进行重要性重采样,以得到待跟踪目标的位置;根据整体运动矢量和待跟踪目标的位置对目标的分块颜色和边缘分布的外观特征进行更新,以对待跟踪目标进行跟踪。本发明的实施例能够很好地适应在光线变化强烈或目标外观存在较大变化时,有效地对目标的位置进行调整和目标外观进行更新,从而提高了目标跟踪鲁棒性。
-
公开(公告)号:CN1975738A
公开(公告)日:2007-06-06
申请号:CN200610165238.5
申请日:2006-12-15
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明涉及一种将可扩展标记语言文档树转化为紧凑查询树的方法,属于网络数据处理技术领域。首先根据用户给定的关键字集合遍历可扩展标记语言文档树,删除树中不包含用户给定关键字的内容结点和孤立结点,得到可扩展标记语言文档查询树;遍历上述可扩展标记语言文档查询树,删除其中只有一个孩子结点的结构结点,并保持该结构结点的孩子结点与该结构结点的父亲结点之间的连接路径。利用本发明方法得到的紧凑查询树是可扩展标记语言文档查询树的子树,结构简单、明了、紧凑,包含的结点数量少,更加容易操作。而且不包含任何连接结点,用于关键字搜索时,不仅可以得到紧凑的连接树,而且查询结果更加有意义,满足用户的需求。
-
公开(公告)号:CN116128038A
公开(公告)日:2023-05-16
申请号:CN202211610968.7
申请日:2022-12-14
Applicant: 清华大学
Abstract: 本发明提供一种基于逻辑激活函数和层级梯度嫁接法的神经网络训练方法,包括:获取待训练的可解释神经网络;将所述待训练的可解释神经网络输入至预先构建的网络训练模型中,以得到训练结果;其中,所述网络训练模型是基于逻辑激活函数和层级梯度嫁接法构建的。本发明基于逻辑激活函数和层级梯度嫁接法构建了网络训练模型,所述逻辑激活函数利用新的方式模拟短路和断路操作,所述层级梯度嫁接法调整了传播方式,实现可扩展性更好、拟合能力更强的可解释神经网络训练。
-
公开(公告)号:CN115080736A
公开(公告)日:2022-09-20
申请号:CN202210567681.4
申请日:2022-05-23
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本发明提供一种判别式语言模型的模型调整方法及装置,所述方法包括以下步骤:获取预训练的判别式语言模型和下游任务的训练数据集;响应于任务请求,根据所述任务请求的类型和所述训练数据集,对所述预训练的语言模型进行调整;其中,所述判别式语言模型是通过文本样本训练得到的。通过对判别式语言模型在不同的下游任务阶段进行模型参数的调整,消除判别式语言模型在模型预训练阶段与下游任务之间的差别,提高模型的整体效果。
-
-
-
-
-
-
-
-
-