-
公开(公告)号:CN115270817A
公开(公告)日:2022-11-01
申请号:CN202210898773.0
申请日:2022-07-28
Applicant: 南京大学
Abstract: 本申请涉及自然语言处理技术领域,提供一种对话文本处理方法及装置,通过将对话文本中的说话者和话语按时间顺序拼接,得到时间流,聚合不同说话者在所述对话文本中的全部话语,得到说话者流,将得到的时间流和说话者流作为双流输入,以充分利用对话信息。时间流和说话者流是人类理解对话的两个方向,时间流有助于理解对话的发展,而说话者流则按说话者聚合话语,有利于理解不同说话者的信息,同时因为减少说话者的切换,可降低模型理解出错的概率,从而提高模型的忠实度。此外,本申请的说话者流是自动生成的,不需要任何其他资源消耗,例如额外模型预测和人工注释等,这使得本申请可以被低成本地、便捷地应用。