-
公开(公告)号:CN115952290A
公开(公告)日:2023-04-11
申请号:CN202310218333.0
申请日:2023-03-09
Applicant: 太极计算机股份有限公司
IPC: G06F16/35 , G06Q50/18 , G06N3/0464 , G06N3/0442 , G06N3/0895 , G06N3/091
Abstract: 本发明涉及一种基于主动学习和半监督学习的案情特征标注方法、装置和设备,属于智慧司法技术领域,该方法、装置和设备使用主动学习策略选取收益最大的部分样本交给法学专家进行标注,使用半监督学习策略选取置信度最高的部分样本扩充训练集,经过多次迭代后进行多层次多标签的案情特征标注;结合了主动学习和半监督学习的优点,仅需标注较少数据即可获得较大的标注收益和较多的高质量训练样本,并可对案情标签的层次结构和语义关系建模,从而解决当前案情特征标注中存在的全部人工标注成本过高和长尾效应问题,提升标注的效率和准确率。
-
公开(公告)号:CN115952290B
公开(公告)日:2023-06-02
申请号:CN202310218333.0
申请日:2023-03-09
Applicant: 太极计算机股份有限公司
IPC: G06F16/35 , G06Q50/18 , G06N3/0464 , G06N3/0442 , G06N3/0895 , G06N3/091
Abstract: 本发明涉及一种基于主动学习和半监督学习的案情特征标注方法、装置和设备,属于智慧司法技术领域,该方法、装置和设备使用主动学习策略选取收益最大的部分样本交给法学专家进行标注,使用半监督学习策略选取置信度最高的部分样本扩充训练集,经过多次迭代后进行多层次多标签的案情特征标注;结合了主动学习和半监督学习的优点,仅需标注较少数据即可获得较大的标注收益和较多的高质量训练样本,并可对案情标签的层次结构和语义关系建模,从而解决当前案情特征标注中存在的全部人工标注成本过高和长尾效应问题,提升标注的效率和准确率。
-