-
公开(公告)号:CN114171031A
公开(公告)日:2022-03-11
申请号:CN202111423927.2
申请日:2021-11-26
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于多任务学习和对抗训练的声纹识别模型训练方法,涉及声纹技术领域。该方法包括:获取待训练的音频样本集,音频样本集中的每个音频样本标注有用户标签以及领域标签;获取每个音频样本的人声声纹特征以及领域特征;从人声声纹特征中过滤掉领域特征,得到过滤后的人声声纹特征作为人声通用特征;基于每个音频样本的人声通用特征、用户标签以及领域标签,对对抗网络进行训练,直至对抗网络满足预设条件,得到训练后的声纹识别模型。如此,采用了领域对抗训练的方式,增强了训练得到的声纹识别模型在不同环境下的鲁棒性和泛化能力,进而提高了声纹识别模型在面对环境噪声时的识别准确率,提高了用户体验。
-
公开(公告)号:CN114171010A
公开(公告)日:2022-03-11
申请号:CN202111300500.3
申请日:2021-11-04
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于共振峰的语音指令清晰度确定方法,该方法包括:对语音指令信号进行活动语音检测,确定语音指令信号中的活动语音片段;确定活动语音片段中的共振峰所在的频率;根据活动语音片段中的共振峰所在的频率,确定活动语音片段中的指定活动语音子片段;指定活动语音子片段是指活动语音片段中在频率低于频率阈值的频段内存在共振峰的语音子片段;计算第一时长与第二时长的比值,得到目标时长比例,第一时长是指指定活动语音子片段的时长,第二时长是指活动语音片段的时长;根据目标时长比例,确定语音指令信号的清晰度等级。本方案实现了自动确定语音指令信号的清晰度等级。
-
公开(公告)号:CN113724692A
公开(公告)日:2021-11-30
申请号:CN202111172930.1
申请日:2021-10-08
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于声纹特征的电话场景音频获取与抗干扰处理方法。本方法包括:获取音频片段;获取音频片段的至少两个信号特征,至少两个信号特征包括以下任意两项或全部三项:混响时间特征、声纹特征、语音清晰度特征;基于至少两个信号特征,确定音频片段是否为干扰音频片段;若音频片段为干扰音频片段,则对音频片段进行抗干扰处理。本申请从音频片段的多个不同维度的信号特征来判断该音频片段是否为干扰音频片段,因此能更准确地判断音频片段是否为干扰音频片段,为后续抗干扰处理过程提供准确的数据支持。后续去干扰处理时可以尽可能地去除音频片段中的干扰,提高去除音频信号中的干扰的效果,尽可能降低干扰人声对指挥命令造成的影响。
-
公开(公告)号:CN113704424A
公开(公告)日:2021-11-26
申请号:CN202110995559.2
申请日:2021-08-27
Applicant: 广东电力信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N20/00
Abstract: 本发明提供的一种基于指针网络的自然语言任务生成方法,应用于任务型人机对话的业务中,所述生成方法包括:在人机对话过程中,将用户与机器人的整个对话历史文本进行编码,获得编码文本;将所述编码文本采用指针网络进行概率分布统计,获得回复文本;对所述回复文本进行修正处理,获得修正文本。使用指针网络生成的回复文本保留了词表以外的未登录词,同时避免了文本不断重复的问题,不仅融合了上下文,而且机器人保持了与用户一致的沟通方式,使得对话进程更加清晰顺畅。
-
公开(公告)号:CN114528516B
公开(公告)日:2024-09-06
申请号:CN202210018643.3
申请日:2022-01-08
Applicant: 广东电力信息科技有限公司
IPC: G06F16/958 , G06F16/957
Abstract: 本申请公开了一种智慧信息化项目管理方法和装置,该方法包括:接收用户配置的网址信息,其中,所述网络信息为通过浏览器可以访问的网址;调用浏览器并在所述浏览器中写入所述网址信息;从所述浏览器打开的所述网址信息对应的网页中抓取信息;获取所述用户配置的网址信息中的网页对应的项目中的信息输入项;将抓取到的信息根据所述信息输入项保存所述项目对应的信息输入项中。通过本申请解决了项目内容需要手工输入所导致的效率比较低的问题,从而提高了项目输入的效率。
-
公开(公告)号:CN114944144A
公开(公告)日:2022-08-26
申请号:CN202210322437.1
申请日:2022-03-29
Applicant: 广东电力信息科技有限公司
Abstract: 本申请公开了一种针对粤语的语音合成模型的训练方法及语音合成方法,涉及语音处理技术领域。该方法包括:获取目标语言类型对应的第一训练样本集;获取与目标语言类型相关联的第一初始网络,作为初始模型,第一初始网络是基于多种语言类型对应的第二训练样本集训练得到,多种语言类型与所述目标语言类型相关联;将第一文本样本输入至初始模型,得到第一文本样本对应的合成语音;基于第一文本样本对应的合成语音和第一文本样本对应的目标语言类型的第一语音样本,对初始模型进行迭代训练,直至满足第一预设条件,得到训练后的语音合成模型。如此,减小了模型训练需要的训练样本,同时提高了模型训练的效率。
-
公开(公告)号:CN114242120A
公开(公告)日:2022-03-25
申请号:CN202111413158.8
申请日:2021-11-25
Applicant: 广东电力信息科技有限公司
IPC: G11B27/031
Abstract: 本申请实施例公开了一种基于DTMF技术的音频剪辑方法及音频标记方法,涉及音频处理技术领域。该基于DTMF技术的音频剪辑方法通过获取录制音频;识别录制音频中的标记片段,标记片段为进行语音录制的过程中,响应于标记操作生成,标记片段为携带标记信息的DTMF音频;基于标记片段对录制音频进行剪辑处理。以此,可以根据录制音频中的标记片段主动进行剪辑处理,使得剪辑时不需要再识别录制音频中语音的特征,从而使得剪辑过程更便捷,同时极大提高了剪辑结果地准确度。
-
公开(公告)号:CN114171000A
公开(公告)日:2022-03-11
申请号:CN202111446042.4
申请日:2021-11-30
Applicant: 广东电力信息科技有限公司
Abstract: 本申请提供了一种基于声学模型和语言模型的音频识别方法。本方法包括:获取音频片段;基于声学模型对音频片段进行处理,得到音频片段对应的音素序列,音素序列包括用于表征标点符号的标点音素;基于语言模型对音素序列进行处理,得到音素序列对应的文本信息,文本信息包括标点符号。本方法无需引入其他的标点模块和搜索模块对纯文本信息进行处理,通过声学模型和语言模型可以直接得到音频片段对应的带有标点符号的文本信息,使得音频识别更加方便和高效。
-
公开(公告)号:CN113284086A
公开(公告)日:2021-08-20
申请号:CN202110346070.2
申请日:2021-03-31
Applicant: 广东电力信息科技有限公司
Abstract: 本发明公布了提供一种电力稀缺缺陷图像生成及检测方法,包括:获取第一缺陷绝缘子图像以及完整绝缘子图像,并根据所述第一缺陷绝缘子图像将所述完整绝缘子图像转换为缺陷绝缘子图像,得到样本缺陷绝缘子图像;将所述完整绝缘子图像以及所述样本缺陷绝缘子图像训练缺陷绝缘子检测模型,得到训练好的缺陷绝缘子检测模型;将待检测图像输入到所述训练好的缺陷绝缘子检测模型进行检测。通过将完整绝缘子图像转换为缺陷绝缘子图像,增加样本缺陷绝缘子图像的样本量和样本类型,通过数量更多样本缺陷绝缘子图像用于训练缺陷绝缘子检测模型,避免模型过拟合,提高缺陷绝缘子的检测准确度。
-
-
-
-
-
-
-
-