-
公开(公告)号:CN118626630A
公开(公告)日:2024-09-10
申请号:CN202410619514.9
申请日:2024-05-17
Applicant: 南京大学
IPC: G06F16/335 , G06F16/31 , G06F16/35 , G06F40/284 , G06F18/2431 , G06F18/25 , G06F18/20 , G06N3/0455 , G06Q10/04 , G06Q50/18
Abstract: 本发明提出了一种创新的基于预训练模型的量刑辅助推荐方法。本方法注重对案情描述文本的预处理,包括去除不相关的时间关键字和对金额、重量等数值的离散化处理,以及法条信息的精确切分。此外,结合中文预训练模型,无需进行额外特征提取,即可实现将法条知识融合到模型中。本发明的技术路线包括法条数据集的预处理、模型训练、罪名和刑期预测、以及最终的法条推荐,确保了推荐系统的高效性和公正性。通过对比现有技术,本发明在处理数据细节、模型训练效率和预测结果的准确性上都有显著提升,特别是在法条前后件信息的处理和利用预训练模型提取深层语义信息方面,展现了明显的优势。
-
公开(公告)号:CN117009514A
公开(公告)日:2023-11-07
申请号:CN202310575350.X
申请日:2023-05-19
Applicant: 南京大学
IPC: G06F16/35 , G06F16/951 , G06F16/31 , G06F16/335 , G06F40/289 , G06F40/216 , G06N3/0455 , G06N3/047 , G06N3/084 , G06Q50/18
Abstract: 本发明公开了一种基于Transformer的多标签罪名预测方法,包括以下步骤:爬取裁判文书并融合CAIL数据构造数据集;数据预处理,包括从裁判文书中抽取出案件基本情况段落、引用法条列表、罪名等信息,平衡单标签多标签数据,构造词表,去停用词,法条名称标准化;预训练词嵌入层;训练相关法条预测神经网络以获取与案情相关的法条;训练罪名预测神经网络;输出预测的罪名列表。本发明针对罪名预测中一个被告对应多个罪名的预测问题,提出了一种面向数罪并罚的罪名预测方法。另外,针对其他传统罪名预测方法中外部知识不足的问题,提出了一种融合案件基本情况和相关法条的方法,显著提升了模型的性能与可解释性。
-