-
公开(公告)号:CN112951198B
公开(公告)日:2024-08-06
申请号:CN201911156831.7
申请日:2019-11-22
Applicant: 微软技术许可有限责任公司
IPC: G10L13/02 , G10L13/033 , G10H7/00 , G10H1/00
Abstract: 本公开提供了用于歌声合成的方法和装置。可以接收从乐谱中提取的第一乐谱音素信息,所述第一乐谱音素信息包括第一音素以及与所述第一音素相对应的音符的音高和节拍。可以基于所述第一乐谱音素信息,生成与所述第一音素相对应的基频差量和频谱参数。可以通过利用所述基频差量调节所述音符的音高,获得与所述第一音素相对应的基频。可以至少部分地基于所述基频和所述频谱参数,生成与所述第一音素相对应的声学波形。
-
公开(公告)号:CN111696559B
公开(公告)日:2024-01-16
申请号:CN201910199122.0
申请日:2019-03-15
Applicant: 微软技术许可有限责任公司
Abstract: 本公开内容提供了一种用于提供情绪管理辅助的方法。可以接收声音流。可以从所述声音流中检测用户与至少一个对话方之间的语音对话。对话方的身份可以至少根据语音对话中对话方的语音来识别。在语音对话中用户的至少一个语音片段的情绪状态可以被确定出。可以生成与所述语音对话相对应的情绪记录,其中所述情绪记录至少包括所述对话方的身份、所述语音对话的至少一部分内容、以及所述用户的至少一个语音片段的情绪状态。
-
公开(公告)号:CN110718209B
公开(公告)日:2023-07-18
申请号:CN201910916818.0
申请日:2015-02-23
Applicant: 微软技术许可有限责任公司
IPC: G10L13/08 , G10L13/033
Abstract: 提供了多语音字体插值。多语音字体插值引擎允许通过对来自现有的字体的说话者特性和韵律进行插值,而产生具有宽泛的多种说话者特性和/或韵律的计算机生成的话音。使用来自多语音字体的预测模型,多语音字体插值引擎预测对从待说出的文本中所获得的音素序列的说话者特性和/或韵律有影响的参数的值。对于每个参数,通过根据所预测的值的加权的插值而生成额外的参数值。利用经插值的参数值来修改现有的语音字体改变了话音的风格和/或情绪,同时保留了原始的语音的基本音质。多语音字体插值引擎允许说话者特性和/或韵律从一个语音字体移植到另一个语音字体,或者允许针对现有的语音字体而生成全新的说话者特性和/或韵律。
-
公开(公告)号:CN110309270B
公开(公告)日:2023-06-20
申请号:CN201810183271.3
申请日:2018-03-06
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/635 , B25J11/00
Abstract: 本文公开的聊天机器人的唱歌答复技术,将歌曲形式的答复融入到了聊天机器人与用户的会话中,从而增强了聊天机器人的丰富的表现力。
-
公开(公告)号:CN108806656B
公开(公告)日:2022-01-28
申请号:CN201710284177.2
申请日:2017-04-26
Applicant: 微软技术许可有限责任公司
IPC: G10H7/00
Abstract: 根据本公开的实现,提供了一种支持机器自动生成歌曲的方案。在该方案中,用户的输入被用于确定用户关于待生成歌曲的创作意图。基于创作意图生成用于歌曲的歌词。然后,至少部分地基于该歌词,生成歌曲的模板。该模板指示与歌词匹配的旋律。由此,可以自动地创作出符合用户创作意图并且相互匹配的旋律和歌词。
-
-
公开(公告)号:CN111696559A
公开(公告)日:2020-09-22
申请号:CN201910199122.0
申请日:2019-03-15
Applicant: 微软技术许可有限责任公司
Abstract: 本公开内容提供了一种用于提供情绪管理辅助的方法。可以接收声音流。可以从所述声音流中检测用户与至少一个对话方之间的语音对话。对话方的身份可以至少根据语音对话中对话方的语音来识别。在语音对话中用户的至少一个语音片段的情绪状态可以被确定出。可以生成与所述语音对话相对应的情绪记录,其中所述情绪记录至少包括所述对话方的身份、所述语音对话的至少一部分内容、以及所述用户的至少一个语音片段的情绪状态。
-
公开(公告)号:CN111681641A
公开(公告)日:2020-09-18
申请号:CN202010460593.5
申请日:2020-05-26
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于基于短语的端对端文本到语音(TTS)合成的方法和装置。可以获得文本。可以识别所述文本中的目标短语。可以确定所述目标短语的短语上下文。可以至少基于所述目标短语和所述短语上下文来生成与所述目标短语对应的声学特征。可以基于所述声学特征来生成与所述目标短语对应的语音波形。
-
公开(公告)号:CN110309270A
公开(公告)日:2019-10-08
申请号:CN201810183271.3
申请日:2018-03-06
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/635 , B25J11/00
Abstract: 本文公开的聊天机器人的唱歌答复技术,将歌曲形式的答复融入到了聊天机器人与用户的会话中,从而增强了聊天机器人的丰富的表现力。
-
公开(公告)号:CN108806656A
公开(公告)日:2018-11-13
申请号:CN201710284177.2
申请日:2017-04-26
Applicant: 微软技术许可有限责任公司
IPC: G10H7/00
CPC classification number: G10H1/0025 , G10H2210/125 , G10H2220/011 , G10H2220/441 , G10H2240/085 , G10H2240/131 , G10H2250/455 , G10L13/02 , G10H7/00 , G10H2210/101 , G10H2210/111 , G10H2210/151
Abstract: 根据本公开的实现,提供了一种支持机器自动生成歌曲的方案。在该方案中,用户的输入被用于确定用户关于待生成歌曲的创作意图。基于创作意图生成用于歌曲的歌词。然后,至少部分地基于该歌词,生成歌曲的模板。该模板指示与歌词匹配的旋律。由此,可以自动地创作出符合用户创作意图并且相互匹配的旋律和歌词。
-
-
-
-
-
-
-
-
-