-
公开(公告)号:CN117094329B
公开(公告)日:2024-02-02
申请号:CN202311326597.4
申请日:2023-10-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/44 , G06F40/242 , G06F40/30 , G06F40/211 , G10L15/26 , G10L15/18
Abstract: 本发明公开了一种用于解决语音歧义的语音翻译方法及装置,涉及语音翻译技术领域。包括:获取待翻译的语音数据;构建同音异义词词典;将语音数据输入到构建好的语音翻译模型;根据语音数据、同音异义词词典以及语音翻译模型,得到语音数据的翻译文本。本发明构建了一种高效的语音消歧的方法,能够有效地缓解语音翻译模型中的歧义现象,提高语音翻译的准确度。
-
公开(公告)号:CN118038870B
公开(公告)日:2024-06-11
申请号:CN202410440333.X
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种针对大语音模型的指令感知训练方法及装置。针对大语音模型的指令感知训练方法包括:使用麦克风采集音频,获取目标原始数据以及指令音频;根据目标原始数据,获得目标文本数据以及目标音频数据;根据指令音频,获得第一指令文本;根据目标文本数据以及第一指令文本,通过文本大模型进行数据生成,获得指令感知文本数据;对第一指令文本进行差异化处理,获得第二指令文本;根据指令感知文本数据、目标音频数据和第二指令文本,对大语音模型进行优化训练,获得优化大语音模型。本发明是一种面向大语音模型的有效缓解指令跟随能力缺陷的大语音模型训练方法。
-
公开(公告)号:CN118038870A
公开(公告)日:2024-05-14
申请号:CN202410440333.X
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种针对大语音模型的指令感知训练方法及装置。针对大语音模型的指令感知训练方法包括:使用麦克风采集音频,获取目标原始数据以及指令音频;根据目标原始数据,获得目标文本数据以及目标音频数据;根据指令音频,获得第一指令文本;根据目标文本数据以及第一指令文本,通过文本大模型进行数据生成,获得指令感知文本数据;对第一指令文本进行差异化处理,获得第二指令文本;根据指令感知文本数据、目标音频数据和第二指令文本,对大语音模型进行优化训练,获得优化大语音模型。本发明是一种面向大语音模型的有效缓解指令跟随能力缺陷的大语音模型训练方法。
-
公开(公告)号:CN117094329A
公开(公告)日:2023-11-21
申请号:CN202311326597.4
申请日:2023-10-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/44 , G06F40/242 , G06F40/30 , G06F40/211 , G10L15/26 , G10L15/18
Abstract: 本发明公开了一种用于解决语音歧义的语音翻译方法及装置,涉及语音翻译技术领域。包括:获取待翻译的语音数据;构建同音异义词词典;将语音数据输入到构建好的语音翻译模型;根据语音数据、同音异义词词典以及语音翻译模型,得到语音数据的翻译文本。本发明构建了一种高效的语音消歧的方法,能够有效地缓解语音翻译模型中的歧义现象,提高语音翻译的准确度。
-
-
-