-
公开(公告)号:CN111078947B
公开(公告)日:2023-06-02
申请号:CN201911130457.3
申请日:2019-11-19
Applicant: 太极计算机股份有限公司
IPC: G06F16/80
Abstract: 本发明公开了一种基于XML的领域要素提取配置语言系统,该系统包括TZIE语言规则模块、TZIE语言解析器模块、TZIE功能调度器模块,TZIE语言规则模块包括TZIE语言模块、定义领域词典模块、定义要素模块、定义提取方法模块、配置方法关系模块、配置操作符模块;TZIE语言解析器模块把XML文件中的要素提取配置变成计算机代码语言;TZIE功能调度器模块依据要素提取任务中配置的操作符,调用相应的功能。通过跨领域文本要素提取配置,提供了一种跨领域通用的定义要素方式,同时可以根据文本特征配置适合的方法进行提取,tzie将各种技术封装成为功能操作符,形成一个XML配置文件,易于维护和优化。
-
公开(公告)号:CN115952290A
公开(公告)日:2023-04-11
申请号:CN202310218333.0
申请日:2023-03-09
Applicant: 太极计算机股份有限公司
IPC: G06F16/35 , G06Q50/18 , G06N3/0464 , G06N3/0442 , G06N3/0895 , G06N3/091
Abstract: 本发明涉及一种基于主动学习和半监督学习的案情特征标注方法、装置和设备,属于智慧司法技术领域,该方法、装置和设备使用主动学习策略选取收益最大的部分样本交给法学专家进行标注,使用半监督学习策略选取置信度最高的部分样本扩充训练集,经过多次迭代后进行多层次多标签的案情特征标注;结合了主动学习和半监督学习的优点,仅需标注较少数据即可获得较大的标注收益和较多的高质量训练样本,并可对案情标签的层次结构和语义关系建模,从而解决当前案情特征标注中存在的全部人工标注成本过高和长尾效应问题,提升标注的效率和准确率。
-
公开(公告)号:CN115952290B
公开(公告)日:2023-06-02
申请号:CN202310218333.0
申请日:2023-03-09
Applicant: 太极计算机股份有限公司
IPC: G06F16/35 , G06Q50/18 , G06N3/0464 , G06N3/0442 , G06N3/0895 , G06N3/091
Abstract: 本发明涉及一种基于主动学习和半监督学习的案情特征标注方法、装置和设备,属于智慧司法技术领域,该方法、装置和设备使用主动学习策略选取收益最大的部分样本交给法学专家进行标注,使用半监督学习策略选取置信度最高的部分样本扩充训练集,经过多次迭代后进行多层次多标签的案情特征标注;结合了主动学习和半监督学习的优点,仅需标注较少数据即可获得较大的标注收益和较多的高质量训练样本,并可对案情标签的层次结构和语义关系建模,从而解决当前案情特征标注中存在的全部人工标注成本过高和长尾效应问题,提升标注的效率和准确率。
-
公开(公告)号:CN111078947A
公开(公告)日:2020-04-28
申请号:CN201911130457.3
申请日:2019-11-19
Applicant: 太极计算机股份有限公司
IPC: G06F16/80
Abstract: 本发明公开了一种基于XML的领域要素提取配置语言系统,该系统包括TZIE语言规则模块、TZIE语言解析器模块、TZIE功能调度器模块,TZIE语言规则模块包括TZIE语言模块、定义领域词典模块、定义要素模块、定义提取方法模块、配置方法关系模块、配置操作符模块;TZIE语言解析器模块把XML文件中的要素提取配置变成计算机代码语言;TZIE功能调度器模块依据要素提取任务中配置的操作符,调用相应的功能。通过跨领域文本要素提取配置,提供了一种跨领域通用的定义要素方式,同时可以根据文本特征配置适合的方法进行提取,tzie将各种技术封装成为功能操作符,形成一个XML配置文件,易于维护和优化。
-
-
-