-
公开(公告)号:CN116303927A
公开(公告)日:2023-06-23
申请号:CN202310023258.2
申请日:2023-01-06
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/332 , G06F40/295 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种网络模型训练方法、事件抽取方法、设备及存储介质,该模型训练方法包括:从目标任务对应的训练集中获取第一样本数据,以及从辅助任务对应的训练样本中获取第二样本数据;利用第一样本数据训练第一网络模型,以及利用第二样本数据训练第二网络模型;对第一网络模型和第二网络模型之间的若干共享网络层共享梯度更新,对第一网络模型的非共享网络层按照目标任务进行梯度更新,对第二网络模型的非共享网络层按照辅助任务进行梯度更新,其中共享网络层和非共享网络层是利用梯度相似度提前确定的;将第一网络模型作为最终网络模型。通过上述方式,可以实现让第一网络模型学习第二网络模型中的知识,且训练得到一种最终网络模型。
-
公开(公告)号:CN115688902A
公开(公告)日:2023-02-03
申请号:CN202211295855.2
申请日:2022-10-21
Applicant: 哈尔滨工业大学(深圳)
IPC: G06N3/08 , G06F18/214 , G06F18/22 , G06F40/30 , G06F16/9535 , G06N3/0464 , G06N3/0442
Abstract: 本申请公开了一种文本表示模型的训练方法、文本表示方法、电子设备及计算机可读存储介质。该训练方法包括:获取训练集,训练集包括多个文本组,每个文本组包括一个锚样本、多个负样本和多个正样本;针对各个文本组,利用文本表示模型获取文本组中锚样本的表示、各个负样本的表示和各个正样本的表示;基于锚样本的表示与同一文本组中各个负样本的表示之间的相似度,以及锚样本的表示与同一文本组中各个正样本的表示之间的相似度,获得文本表示模型关于锚样本的损失;基于文本表示模型关于各个锚样本的损失,调整文本表示模型的参数。通过上述方式,能够提高对文本表示模型的训练效果。
-
公开(公告)号:CN115238038A
公开(公告)日:2022-10-25
申请号:CN202210876073.1
申请日:2022-07-22
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06K9/62 , G06N3/04
Abstract: 本申请公开了推理路径显示方法、计算机设备及计算机可读存储介质。通过从问题出发自顶向下迭代式构建推理路径,在每一步推理过程中预测新节点及其与现有推理路径节点的连接,保证了可解释性的同时大大提高了推理路径的构建效率和性能,同时能够生成含有FAIL节点的推理路径,将推理策略融合进推理路径的生成之中。
-
-