一种区分句子中是否含有攻击性语言的方法

    公开(公告)号:CN117973391A

    公开(公告)日:2024-05-03

    申请号:CN202410288514.5

    申请日:2024-03-14

    Applicant: 新疆大学

    Inventor: 龙军 李晨昊

    Abstract: 一种区分句子中是否含有攻击性语言的方法,其属于语义识别的技术领域。该方法中孪生问题通道采用多回合对话方式,对同一个句子从多个角度进行分析,借助于大模型指令调优的效果,可以从句子中获取到更多的信息更好地探索出句子中是否含有攻击性成分。通过判断被描述主体、描述词和是否还有暗讽以达到最终目的:判断这个句子是否具有攻击性。该方法以指令调优的方式在T5模型进行处理,通过对大量数据进行训练构建孪生问题通道,对比于Bert和GPT3,采用指令调优的方式在T5上进行实验效果最好,因为指令调优拥有更强的推理能力,有着泛化到未见过任务的卓越能力,可以在减少开支的情况下更好地解决攻击性语言识别的问题。在多个基准数据集的实验中,该方法对诸多样本数据baseline有着显著性的改进,同时在OLID、TRAC和与Hasoc三个数据集上实现了新的SOTA结果。

Patent Agency Ranking