-
公开(公告)号:CN115312029A
公开(公告)日:2022-11-08
申请号:CN202211244884.6
申请日:2022-10-12
Applicant: 之江实验室
Abstract: 本发明公开了一种基于语音深度表征映射的语音翻译方法及系统属于人工智能领域,涉及人工智能领域,本发明基于语音深度表征映射的语音翻译方法及海量无标注数据和大量成对数据训练深度学习模型,可以方便的使用海量影视等媒体数据进行模型训练,方便的应用于各种语言语音的互译,提供了一种便捷通用的语音互译方案;本发明基于语音深度表征映射的语音翻译方法提供了一种声纹嵌入的声码器进行语音合成,可实现语音翻译发音音色指定可控,并且能够使得合成的语音保真度更高;本发明的语音深度表征映射的语音翻译系统集成了基于语音深度表征映射的语音翻译方法,能够实现语音直接翻译任务,简化了语音翻译的流程,提高了语音翻译的精度。
-
公开(公告)号:CN115048944A
公开(公告)日:2022-09-13
申请号:CN202210981384.4
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F40/35 , G06F40/284 , G06F40/268 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于主题增强的开放域对话回复方法及系统,该方法包括:步骤一:采集并预处理得到中文对话语料数据集;步骤二:利用自然语言处理工具包进行对话的断句、分词和词性标注并抽取名词性词语;步骤三:对每一句对话进行语义及主题信息的增强处理,后使用预训练句子表征模型学习原始句子与增强后句子的向量表征;步骤四:使用图卷积神经网络提取对话句子的语义及主题信息,并进行主题聚合增强的处理;步骤五:将主题聚合增强后的句向量输入预训练的生成模型,生成对话回复候选集,最后采用对比学习方法训练回复排序选择模型选出最适合的回复。本发明解决了开放域对话回复生成中的生成回复主题不一致性的问题,提高了回复生成的效果。
-