-
公开(公告)号:CN116821339B
公开(公告)日:2024-12-06
申请号:CN202310737400.X
申请日:2023-06-20
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F18/2415 , G06F40/58 , G06F40/30 , G06F40/284 , G06F40/216 , G06N3/045 , G06N3/047 , G06N3/082
Abstract: 本申请提供一种滥用语言检测方法、装置及存储介质。该方法包括:将待处理语言文本输入至滥用语言检测模型中,获得待处理语言文本的类别预测概率;所述滥用语言检测模型是基于跨语言对比损失、源语言文本的分类交叉熵损失和目标语言文本的分类交叉熵损失进行训练得到的,所述目标语言文本是基于源语言文本翻译得到的平行译文。本申请提供的滥用语言检测方法、装置及存储介质,通过从不同语言文本中学习内在关系来训练滥用语言检测模型,提高了该模型跨语言知识迁移能力,提高了滥用语言检测结果的准确性。
-
公开(公告)号:CN116821339A
公开(公告)日:2023-09-29
申请号:CN202310737400.X
申请日:2023-06-20
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F18/2415 , G06F40/58 , G06F40/30 , G06F40/284 , G06F40/216 , G06N3/045 , G06N3/047 , G06N3/082
Abstract: 本申请提供一种滥用语言检测方法、装置及存储介质。该方法包括:将待处理语言文本输入至滥用语言检测模型中,获得待处理语言文本的类别预测概率;所述滥用语言检测模型是基于跨语言对比损失、源语言文本的分类交叉熵损失和目标语言文本的分类交叉熵损失进行训练得到的,所述目标语言文本是基于源语言文本翻译得到的平行译文。本申请提供的滥用语言检测方法、装置及存储介质,通过从不同语言文本中学习内在关系来训练滥用语言检测模型,提高了该模型跨语言知识迁移能力,提高了滥用语言检测结果的准确性。
-