语音合成方法、装置、电子设备及存储介质

    公开(公告)号:CN113643684B

    公开(公告)日:2024-02-27

    申请号:CN202110827082.7

    申请日:2021-07-21

    Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及语音处理技术领域。该方法包括:在语音播报的过程中,当检测到用户的输入语音时,识别所述输入语音的语音特征;根据所述语音特征,确定用于播报语音的语音参数,所述语音参数用于针对待播报的文本信息生成与所述语音参数对应的语音;基于对所述待播报的文本信息的语法分析,将标识信息添加至所述待播报的文本信息中,得到目标文本信息;基于所述语音参数以及目标文本信息,生成用于播报的目标语音。如此,可以根据用户的语音特征,确定对应的语音参数,并基于该语音参数生成与(56)对比文件CN 109451188 A,2019.03.08彭永超.基于Android的车载语音助手设计与实现《.中国优秀硕士学位论文全文数据库信息科技辑》.2020,全文.

    一种针对粤语音频的拓展方法及语音识别方法

    公开(公告)号:CN114694655A

    公开(公告)日:2022-07-01

    申请号:CN202210314205.1

    申请日:2022-03-28

    Abstract: 本申请公开了一种针对粤语音频的拓展方法,包括:获取样本音频集中各样本音频对应的音素文本;根据样本音频集中各样本音频对应的音素文本,统计各音素的音素词频;对于各样本音频,将样本音频所对应音素文本中音素对应的音素词频进行均值计算,得到样本音频对应的第一平均词频;根据样本音频对应的第一平均词频,确定样本音频对应的拓展权重;根据各样本音频对应的拓展权重,在样本音频集中确定待拓展的目标样本音频;将目标样本音频进行音频拓展,得到拓展音频;拓展音频和样本音频集中的样本音频用于对语音识别模型进行训练。通过本申请的方法能够解决用于训练语音识别模型的音频发音分布不均衡的问题,保证语音识别模型的识别准确度。

    一种智慧信息化项目管理方法和装置

    公开(公告)号:CN114528516A

    公开(公告)日:2022-05-24

    申请号:CN202210018643.3

    申请日:2022-01-08

    Abstract: 本申请公开了一种智慧信息化项目管理方法和装置,该方法包括:接收用户配置的网址信息,其中,所述网络信息为通过浏览器可以访问的网址;调用浏览器并在所述浏览器中写入所述网址信息;从所述浏览器打开的所述网址信息对应的网页中抓取信息;获取所述用户配置的网址信息中的网页对应的项目中的信息输入项;将抓取到的信息根据所述信息输入项保存所述项目对应的信息输入项中。通过本申请解决了项目内容需要手工输入所导致的效率比较低的问题,从而提高了项目输入的效率。

    一种基于记忆网络的对话策略状态跟踪方法及系统

    公开(公告)号:CN113704426A

    公开(公告)日:2021-11-26

    申请号:CN202110997388.7

    申请日:2021-08-27

    Abstract: 本发明提供的一种基于记忆网络的对话策略状态跟踪方法及系统,跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将原始对话语言文本预处理,获得神经网络里内在的词向量;将词向量存储在所述记忆数组的下一个位置;根据词向量在所有记忆数组中选择出最相关的k个记忆单元;获取原始对话语言文本和最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与相关记忆参数的相关性,获得计算得分;获取计算得分中最相关的语言文本。强化模型的记忆存储能力,使得整个对话系统保留更多的语义信息,提升了对话机器人对意图的理解和对关键信息的把握。提升了对话机器人对任务的理解。

    语音合成方法、装置、电子设备及存储介质

    公开(公告)号:CN113643684A

    公开(公告)日:2021-11-12

    申请号:CN202110827082.7

    申请日:2021-07-21

    Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及语音处理技术领域。该方法包括:在语音播报的过程中,当检测到用户的输入语音时,识别所述输入语音的语音特征;根据所述语音特征,确定用于播报语音的语音参数,所述语音参数用于针对待播报的文本信息生成与所述语音参数对应的语音;基于对所述待播报的文本信息的语法分析,将标识信息添加至所述待播报的文本信息中,得到目标文本信息;基于所述语音参数以及目标文本信息,生成用于播报的目标语音。如此,可以根据用户的语音特征,确定对应的语音参数,并基于该语音参数生成与针对该用户的个性化的目标语音,提升了用户的语音交互体验。

    自适应切换方言语音的电话催缴方法、装置及语音机器人

    公开(公告)号:CN115376489A

    公开(公告)日:2022-11-22

    申请号:CN202210947087.8

    申请日:2022-08-08

    Abstract: 本发明公开了一种自适应切换方言语音的电话催缴方法、装置及语音机器人。该方法包括:在与用户终端建立语音通信通道时,通过预先构建的新方言语音合成模型合成探测语句,向用户终端发送探测语句;接收用户终端发送的回复语句,通过预先构建的旧方言分类模型识别回复语句对应的旧方言作为目标方言;通过新方言语音合成模型合成第一过渡语句,通过目标方言对应的旧方言语音合成模型合成第二过渡语句,并根据第一过渡语句和第二过渡语句得到过渡语句,向用户终端发送过渡语句;通过旧方言语音合成模型合成催缴语句,向用户终端发送催缴语句。本发明能够有效保证用户知晓催缴内容,提高电话催缴成功率,实现进一步提高电话催缴效率。

    一种基于语音识别的催费方法和装置

    公开(公告)号:CN115271230A

    公开(公告)日:2022-11-01

    申请号:CN202210942204.1

    申请日:2022-08-08

    Abstract: 本发明提供了一种基于语音识别的催费方法和装置,所述方法包括:获取催费对象终端的回答信息,并根据所述回答信息,识别所述催费对象的用户意图;当用户意图为进一步咨询时,调用用电统计信息,发送用电量信息;并向催费对象终端发送异常用电提示;当所述用户意图为承诺缴费时,基于第二预设时间范围内的用电统计信息的分析结果,预估未来用电量,生成预存电费建议;当用户意图为身份阻却事由时或时间阻却事由,发送结束语并结束通话。相比于现有技术,避免了催费效果的不稳定性以及催费过程可能发生的冲突,提高了催费效率并降低了消耗的人力物力;根据意图使用对应的催费方法,响应快速并具有针对性,提高用户的体验以及服务的质量。

    一种基于热词的会议语音识别方法

    公开(公告)号:CN114121015A

    公开(公告)日:2022-03-01

    申请号:CN202111284401.0

    申请日:2021-11-01

    Abstract: 本申请公开了一种基于热词的会议语音识别方法。本方法包括:获取第一音频的第一识别结果,第一识别结果是对第一音频进行音频识别得到的,第一识别结果包括表征第一音频的内容的词汇;获取对第一识别结果进行修正而得到的第一修正结果;将包含于第一修正结果并且不包含于第一识别结果的词汇确定为至少一个热词;基于至少一个热词,获取第二音频的第二识别结果。在本方法中,在对第一识别结果进行修正后,电子设备将第一修正结果中包含但第一识别结果中不包含的词汇确定为热词。因此在后续的音频识别中,即使电子设备不能准确识别某些技术名词,也能基于热词提高对上述未识别到的技术名词的识别概率,增加音频识别的准确性。

Patent Agency Ranking