-
公开(公告)号:CN120067333A
公开(公告)日:2025-05-30
申请号:CN202510226003.5
申请日:2025-02-27
Applicant: 大连理工大学
IPC: G06F16/353 , G06F40/284 , G06F40/151 , G06F18/213 , G06F18/10 , G06N3/045 , G06N3/047 , G06N3/09 , G06N5/01
Abstract: 本发明涉及自然语言处理技术领域,提出一种基于多特征的机器生成自然语言检测方法,包括获取待检测文本,并对待检测文本进行预处理,得到预处理文本;将预处理文本输入预训练语言模型的分词器进行文本分词并将分词转换为预训练语言模型可识别的词元序列,将词元序列输入预训练语言模型中进行运算,获取每个词元的未归一化预测概率;根据词元序列和每个词元的未归一化预测概率计算文本的11种特征;将11种特征拼合成一个11维向量,并输入到机器学习分类算法中进行监督学习,得到机器生成自然语言检测器;将待检测的文本输入机器生成自然语言检测器中,得到检测结果。本发明检测速度快、检测准确度稿且检测方法的可信度与透明度高。