-
公开(公告)号:CN118446202A
公开(公告)日:2024-08-06
申请号:CN202410558437.0
申请日:2024-05-08
Applicant: 北京理工大学
IPC: G06F40/194 , G06F40/16 , G06F18/22 , G06F18/214 , G06F18/21 , G06F18/25
Abstract: 本发明涉及一种基于写作风格的生成文本来源检测方法,属于人工智能与文本检测技术领域,该方法包括:S1,生成文本内容的识别与编码;S2,特征提取;S3,特征输入与融合;S4,损失函数计算与优化;S5,训练模型;S6,根据训练好的模型,验证集评估模型的准确率和召回率,根据结果优化模型参数。在步骤S3中,对于每个文本样本,使用Llama2计算其困惑度分数。本发明使用多维特征融合框架,通过计算文本困惑度分数和嵌入向量并将其融合来代表各个文本生成源的写作风格,有效捕获了群体写作风格的核心特征,增强了文本源的区分能力,显著地提升了基于写作风格的识别性能,对保护文本的真实性有重要的意义。