-
公开(公告)号:CN116796836A
公开(公告)日:2023-09-22
申请号:CN202310856616.8
申请日:2023-07-12
Applicant: 之江实验室
Abstract: 本发明涉及一种基于多层奖励和分步训练的知识图谱截取方法和设备,用于根据知识图谱中选定的多个节点,得到与选定节点所属领域相关的子图,方法包括数学建模、分布训练和模型使用三部分。在数学建模过程中设计基于episode和基于step的奖励,在训练过程中首先基于有监督学习的策略网络初步训练,然后基于奖励的再训练。与现有技术相比,本发明实现从知识图谱中基于给定的若干节点来截取所属领域的子图的同时,具有模型建模准确度高、训练收敛性好等优点。
-
公开(公告)号:CN114611715A
公开(公告)日:2022-06-10
申请号:CN202210512110.0
申请日:2022-05-12
Abstract: 本发明公开了基于标注者可靠度时序建模的众包主动学习方法和装置,所述方法包括以下步骤:初始化预测模型并建立可靠度时序模型,样本选择策略,众包标注者选择策略,样本分配策略,模型更新,迭代运算。本发明结合众包学习、主动学习以及时间序列建模,基于众包标注者可靠度时序建模,对标注者可靠度的变化进行实时追踪并筛选出可靠度最高的众包标注者,通过迭代运算不断更新更优的众包标注者以及信息度高的样本对预测模型不断优化,降低了众包标注成本,减少了低可靠度的标注者在学习中的负面影响,有效地提高了众包标签的质量以及预测模型的性能。
-
公开(公告)号:CN116029298A
公开(公告)日:2023-04-28
申请号:CN202310117049.4
申请日:2023-02-14
IPC: G06F40/295 , G06F40/216 , G06F16/33
Abstract: 本说明书公开了一种模型训练的方法、装置、设备及存储介质,可以先通过预测模型对各待标记样本集进行标记,并将标记结果为指定标记结果的各待标记样本集中的各待标记样本筛选出来,交由标记人员进行人工标记。这里的指定标记结果是指预先设置的预测模型容易出现识别错误的一类样本的标记结果。从而可以根据标记人员针对预测模型容易出现识别错误的一类样本的标记结果,对用于训练预测模型的待标记样本集进行拆分、重新聚合得到新的样本集,并使用新的样本集对预测模型进行训练,进而可以在减少需要人工标记的样本的数量以降低预测模型的训练成本的同时,提升预测模型的训练效果。
-
公开(公告)号:CN114611715B
公开(公告)日:2022-08-23
申请号:CN202210512110.0
申请日:2022-05-12
Abstract: 本发明公开了基于标注者可靠度时序建模的众包主动学习方法和装置,所述方法包括以下步骤:初始化预测模型并建立可靠度时序模型,样本选择策略,众包标注者选择策略,样本分配策略,模型更新,迭代运算。本发明结合众包学习、主动学习以及时间序列建模,基于众包标注者可靠度时序建模,对标注者可靠度的变化进行实时追踪并筛选出可靠度最高的众包标注者,通过迭代运算不断更新更优的众包标注者以及信息度高的样本对预测模型不断优化,降低了众包标注成本,减少了低可靠度的标注者在学习中的负面影响,有效地提高了众包标签的质量以及预测模型的性能。
-
-
-