-
公开(公告)号:CN118504587B
公开(公告)日:2024-12-03
申请号:CN202410658392.4
申请日:2024-05-27
Applicant: 中南大学
IPC: G06F40/35 , G06F40/295 , G06N20/00
Abstract: 本发明涉及一种基于解耦预训练的多意图对话语言理解方法及系统,方法包括:使用命名体识别训练数据对预置对话语言模型进行任务无关能力预训练得到第一阶段模型;利用单意图对话语言理解训练数据对第一阶段模型进行任务特定能力预训练得到第二阶段模型;通过多意图对话语言理解微调数据对第二阶段模型进行调整,得到多意图对话语言理解模型;基于多意图对话语言理解模型对待分析多意图对话请求进行处理,得到多个意图和槽位。仅需利用相对丰富且容易获得的命名体识别训练数据、单意图对话语言理解数据和少量的多意图对话语言理解微调数据即可实现更好的多意图对话语言理解的效果,极大地缓解了多意图对话语言理解研究所面临的数据稀缺问题。
-
公开(公告)号:CN118504587A
公开(公告)日:2024-08-16
申请号:CN202410658392.4
申请日:2024-05-27
Applicant: 中南大学
IPC: G06F40/35 , G06F40/295 , G06N20/00
Abstract: 本发明涉及一种基于解耦预训练的多意图对话语言理解方法及系统,方法包括:使用命名体识别训练数据对预置对话语言模型进行任务无关能力预训练得到第一阶段模型;利用单意图对话语言理解训练数据对第一阶段模型进行任务特定能力预训练得到第二阶段模型;通过多意图对话语言理解微调数据对第二阶段模型进行调整,得到多意图对话语言理解模型;基于多意图对话语言理解模型对待分析多意图对话请求进行处理,得到多个意图和槽位。仅需利用相对丰富且容易获得的命名体识别训练数据、单意图对话语言理解数据和少量的多意图对话语言理解微调数据即可实现更好的多意图对话语言理解的效果,极大地缓解了多意图对话语言理解研究所面临的数据稀缺问题。
-
-
公开(公告)号:CN116702091A
公开(公告)日:2023-09-05
申请号:CN202310737347.3
申请日:2023-06-21
Applicant: 中南大学
IPC: G06F18/25 , G06F18/2415 , G06F18/2451 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于多视图CLIP的多模态讽刺意图识别方法、装置和设备,方法包括:对数据元组中的文本信息和图像信息均依次编码和解码;其中,采用CLIP模型编码分别得到文本和图像各自的向量表示,解码分别得到基于文本视图和图像视图的讽刺得分分布;将编码得到的文本和图像各自向量表示拼接后,喂入transformer进行模态融合,然后采用key‑less注意力机制确定其注意力权重,再解码得到基于文本与图像交互视图的讽刺得分分布;将基于文本视图、基于图像视图及基于文本与图像交互视图的3个讽刺得分分布进行聚合,并根据聚合结果获得数据元组的讽刺意图识别结果。本发明提升了讽刺意图识别准确率,且有良好的解释性。
-
-
-