-
公开(公告)号:CN113643684B
公开(公告)日:2024-02-27
申请号:CN202110827082.7
申请日:2021-07-21
Applicant: 广东电力信息科技有限公司
IPC: G10L13/02 , G10L15/02 , G10L15/26 , G06F40/191 , G06F40/253
Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及语音处理技术领域。该方法包括:在语音播报的过程中,当检测到用户的输入语音时,识别所述输入语音的语音特征;根据所述语音特征,确定用于播报语音的语音参数,所述语音参数用于针对待播报的文本信息生成与所述语音参数对应的语音;基于对所述待播报的文本信息的语法分析,将标识信息添加至所述待播报的文本信息中,得到目标文本信息;基于所述语音参数以及目标文本信息,生成用于播报的目标语音。如此,可以根据用户的语音特征,确定对应的语音参数,并基于该语音参数生成与(56)对比文件CN 109451188 A,2019.03.08彭永超.基于Android的车载语音助手设计与实现《.中国优秀硕士学位论文全文数据库信息科技辑》.2020,全文.
-
公开(公告)号:CN114694655A
公开(公告)日:2022-07-01
申请号:CN202210314205.1
申请日:2022-03-28
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种针对粤语音频的拓展方法,包括:获取样本音频集中各样本音频对应的音素文本;根据样本音频集中各样本音频对应的音素文本,统计各音素的音素词频;对于各样本音频,将样本音频所对应音素文本中音素对应的音素词频进行均值计算,得到样本音频对应的第一平均词频;根据样本音频对应的第一平均词频,确定样本音频对应的拓展权重;根据各样本音频对应的拓展权重,在样本音频集中确定待拓展的目标样本音频;将目标样本音频进行音频拓展,得到拓展音频;拓展音频和样本音频集中的样本音频用于对语音识别模型进行训练。通过本申请的方法能够解决用于训练语音识别模型的音频发音分布不均衡的问题,保证语音识别模型的识别准确度。
-
公开(公告)号:CN114528516A
公开(公告)日:2022-05-24
申请号:CN202210018643.3
申请日:2022-01-08
Applicant: 广东电力信息科技有限公司
IPC: G06F16/958 , G06F16/957
Abstract: 本申请公开了一种智慧信息化项目管理方法和装置,该方法包括:接收用户配置的网址信息,其中,所述网络信息为通过浏览器可以访问的网址;调用浏览器并在所述浏览器中写入所述网址信息;从所述浏览器打开的所述网址信息对应的网页中抓取信息;获取所述用户配置的网址信息中的网页对应的项目中的信息输入项;将抓取到的信息根据所述信息输入项保存所述项目对应的信息输入项中。通过本申请解决了项目内容需要手工输入所导致的效率比较低的问题,从而提高了项目输入的效率。
-
公开(公告)号:CN113704426A
公开(公告)日:2021-11-26
申请号:CN202110997388.7
申请日:2021-08-27
Applicant: 广东电力信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N3/04 , G06N3/08
Abstract: 本发明提供的一种基于记忆网络的对话策略状态跟踪方法及系统,跟踪方法包括:网络模型包括多个记忆数组;获取原始对话语言文本;将原始对话语言文本预处理,获得神经网络里内在的词向量;将词向量存储在所述记忆数组的下一个位置;根据词向量在所有记忆数组中选择出最相关的k个记忆单元;获取原始对话语言文本和最相关的k个记忆单元,获得相关记忆参数;使用评分函数计算候选词与相关记忆参数的相关性,获得计算得分;获取计算得分中最相关的语言文本。强化模型的记忆存储能力,使得整个对话系统保留更多的语义信息,提升了对话机器人对意图的理解和对关键信息的把握。提升了对话机器人对任务的理解。
-
公开(公告)号:CN113643684A
公开(公告)日:2021-11-12
申请号:CN202110827082.7
申请日:2021-07-21
Applicant: 广东电力信息科技有限公司
IPC: G10L13/02 , G10L15/02 , G10L15/26 , G06F40/191 , G06F40/253
Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及语音处理技术领域。该方法包括:在语音播报的过程中,当检测到用户的输入语音时,识别所述输入语音的语音特征;根据所述语音特征,确定用于播报语音的语音参数,所述语音参数用于针对待播报的文本信息生成与所述语音参数对应的语音;基于对所述待播报的文本信息的语法分析,将标识信息添加至所述待播报的文本信息中,得到目标文本信息;基于所述语音参数以及目标文本信息,生成用于播报的目标语音。如此,可以根据用户的语音特征,确定对应的语音参数,并基于该语音参数生成与针对该用户的个性化的目标语音,提升了用户的语音交互体验。
-
公开(公告)号:CN114242120B
公开(公告)日:2023-11-10
申请号:CN202111413158.8
申请日:2021-11-25
Applicant: 广东电力信息科技有限公司
IPC: G11B27/031
Abstract: 本申请实施例公开了一种基于DTMF技术的音频剪辑方法及音频标记方法,涉及音频处理技术领域。该基于DTMF技术的音频剪辑方法通过获取录制音频;识别录制音频中的标记片段,标记片段为进行语音录制的过程中,响应于标记操作生成,标记片段为携带标记信息的DTMF音频;基于标记片段对录制音频进行剪辑处理。以此,可以根据录制音频中的标记片段主动进行剪辑处理,使得剪辑时不需要再识别录制音频中语音的特征,从而使得剪辑过程更便捷,同时极大提高了剪辑结果地准确度。
-
公开(公告)号:CN115376489A
公开(公告)日:2022-11-22
申请号:CN202210947087.8
申请日:2022-08-08
Applicant: 广东电力信息科技有限公司
IPC: G10L15/00 , G10L13/027 , H04M3/493
Abstract: 本发明公开了一种自适应切换方言语音的电话催缴方法、装置及语音机器人。该方法包括:在与用户终端建立语音通信通道时,通过预先构建的新方言语音合成模型合成探测语句,向用户终端发送探测语句;接收用户终端发送的回复语句,通过预先构建的旧方言分类模型识别回复语句对应的旧方言作为目标方言;通过新方言语音合成模型合成第一过渡语句,通过目标方言对应的旧方言语音合成模型合成第二过渡语句,并根据第一过渡语句和第二过渡语句得到过渡语句,向用户终端发送过渡语句;通过旧方言语音合成模型合成催缴语句,向用户终端发送催缴语句。本发明能够有效保证用户知晓催缴内容,提高电话催缴成功率,实现进一步提高电话催缴效率。
-
公开(公告)号:CN115271230A
公开(公告)日:2022-11-01
申请号:CN202210942204.1
申请日:2022-08-08
Applicant: 广东电力信息科技有限公司
IPC: G06Q10/04 , G06Q50/06 , G06K9/62 , G06F16/215 , G10L15/22
Abstract: 本发明提供了一种基于语音识别的催费方法和装置,所述方法包括:获取催费对象终端的回答信息,并根据所述回答信息,识别所述催费对象的用户意图;当用户意图为进一步咨询时,调用用电统计信息,发送用电量信息;并向催费对象终端发送异常用电提示;当所述用户意图为承诺缴费时,基于第二预设时间范围内的用电统计信息的分析结果,预估未来用电量,生成预存电费建议;当用户意图为身份阻却事由时或时间阻却事由,发送结束语并结束通话。相比于现有技术,避免了催费效果的不稳定性以及催费过程可能发生的冲突,提高了催费效率并降低了消耗的人力物力;根据意图使用对应的催费方法,响应快速并具有针对性,提高用户的体验以及服务的质量。
-
公开(公告)号:CN114360561A
公开(公告)日:2022-04-15
申请号:CN202111484420.8
申请日:2021-12-07
Applicant: 广东电力信息科技有限公司
IPC: G10L21/0208 , G10L25/30 , G10L15/06 , G10L15/16 , G10L19/26
Abstract: 本申请公开了一种基于深度神经网络技术的语音增强方法,通过获取待处理语音数据;将待处理语音数据输入至预先训练的神经网络模型,获得神经网络模型输出的增强语音数据;增强语音数据为待处理语音数据滤除噪音数据后得到;其中,预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。以此,通过预先训练的神经网络模型对待处理语音数据进行处理,可以快速、有效抑制噪声数据,且预先训练的神经网络模型通过对解码输出信息进行去除冗余处理,更专注于有效信息,明显提升降噪效果。
-
公开(公告)号:CN114121015A
公开(公告)日:2022-03-01
申请号:CN202111284401.0
申请日:2021-11-01
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于热词的会议语音识别方法。本方法包括:获取第一音频的第一识别结果,第一识别结果是对第一音频进行音频识别得到的,第一识别结果包括表征第一音频的内容的词汇;获取对第一识别结果进行修正而得到的第一修正结果;将包含于第一修正结果并且不包含于第一识别结果的词汇确定为至少一个热词;基于至少一个热词,获取第二音频的第二识别结果。在本方法中,在对第一识别结果进行修正后,电子设备将第一修正结果中包含但第一识别结果中不包含的词汇确定为热词。因此在后续的音频识别中,即使电子设备不能准确识别某些技术名词,也能基于热词提高对上述未识别到的技术名词的识别概率,增加音频识别的准确性。
-
-
-
-
-
-
-
-
-