基于可视化特征分析的文本检测方法及系统

    公开(公告)号:CN119293229A

    公开(公告)日:2025-01-10

    申请号:CN202410711790.8

    申请日:2024-06-04

    Applicant: 南昌大学

    Abstract: 本发明提出一种基于可视化特征分析的文本检测方法及系统,该方法包括:特征提取阶段,采用的特征提取器由一个BERT模型和一个MLP分类器组成,以提取MLP的倒数第二层,对应于最后一个隐藏层,得到数据集中的文本特征;模型训练阶段,包括对分类中心c和分类半径r的初始化、数据集训练以及增强统一模式;文本检测阶段,提取待检测文本的文本特征,并根据所述待检测文本的文本特征获取特征距离分类中心c的距离和分类半径r,并根据所述特征距离分类中心c的距离和所述分类半径r判断所述待检测文本是否属于生成文本。本申请能够有效地检测人工智能生成的文本,提高检测准确率和泛化能力。

Patent Agency Ranking