-
公开(公告)号:CN112201249B
公开(公告)日:2024-05-17
申请号:CN202011053209.6
申请日:2020-09-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G10L15/26 , G10L15/02 , H04N17/00 , H04N21/2187
Abstract: 本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取目标语音;将所述目标语音输入至语音处理模型的语音识别网络,根据所述语音识别网络的隐藏层的输出得到语音特征提取结果;所述语音特征提取结果包括所述目标语音的文本特征和高级语义特征;将所述语音特征提取结果输入至所述语音处理模型的语义理解网络,得到所述目标语音的语义理解结果。本公开提高了对输入语音内容理解的准确性,当应用于直播视频内容的异常检测时,可以提高对直播视频内容异常检测的准确性。
-
公开(公告)号:CN112201249A
公开(公告)日:2021-01-08
申请号:CN202011053209.6
申请日:2020-09-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G10L15/26 , G10L15/02 , H04N17/00 , H04N21/2187
Abstract: 本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取目标语音;将所述目标语音输入至语音处理模型的语音识别网络,根据所述语音识别网络的隐藏层的输出得到语音特征提取结果;所述语音特征提取结果包括所述目标语音的文本特征和高级语义特征;将所述语音特征提取结果输入至所述语音处理模型的语义理解网络,得到所述目标语音的语义理解结果。本公开提高了对输入语音内容理解的准确性,当应用于直播视频内容的异常检测时,可以提高对直播视频内容异常检测的准确性。
-
公开(公告)号:CN114187919B
公开(公告)日:2024-11-22
申请号:CN202111499834.8
申请日:2021-12-09
Applicant: 北京达佳互联信息技术有限公司
IPC: G10L21/007 , G10L15/26 , G06F40/289
Abstract: 本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取待处理语音的初始分词和音乐伴奏的伴奏节奏时间戳;所述初始分词为所述待处理语音的语音识别词;根据所述伴奏节奏时间戳,对所述初始分词进行更新,得到所述待处理语音的目标分词;将所述目标分词的分词时间戳和伴奏节奏时间戳进行时间对齐处理,得到所述目标分词的分词时间戳和所述伴奏节奏时间戳之间的目标对应关系;根据所述待处理语音、所述音乐伴奏和所述目标对应关系,生成所述待处理语音对应的音乐。采用本方法,有利于提高生成的音乐的音乐效果。
-
公开(公告)号:CN113240004B
公开(公告)日:2024-04-30
申请号:CN202110512985.6
申请日:2021-05-11
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/045 , G10L15/26
Abstract: 本公开关于一种视频信息确定方法、装置、电子设备以及存储介质,属于多媒体技术领域,该方法是一种多模态特征融合的方法,首先将目标视频的图像特征和音频特征拼接,以得到能够体现目标视频的多模态信息的第一特征,使后续的目标视频信息确定更为准确。将该第一特征输入视频分类模型对目标视频进行分类,以初步确定该目标视频的分类结果,然后通过对目标视频的分类结果和多模态特征进行拼接,以得到能够对该目标视频进行整体描述的第二特征,由于该第二特征能够更全面的描述该目标视频,因此大大提高了所获取的视频信息的准确性。
-
公开(公告)号:CN113240004A
公开(公告)日:2021-08-10
申请号:CN202110512985.6
申请日:2021-05-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种视频信息确定方法、装置、电子设备以及存储介质,属于多媒体技术领域,该方法是一种多模态特征融合的方法,首先将目标视频的图像特征和音频特征拼接,以得到能够体现目标视频的多模态信息的第一特征,使后续的目标视频信息确定更为准确。将该第一特征输入视频分类模型对目标视频进行分类,以初步确定该目标视频的分类结果,然后通过对目标视频的分类结果和多模态特征进行拼接,以得到能够对该目标视频进行整体描述的第二特征,由于该第二特征能够更全面的描述该目标视频,因此大大提高了所获取的视频信息的准确性。
-
公开(公告)号:CN112528049B
公开(公告)日:2023-08-08
申请号:CN202011494362.2
申请日:2020-12-17
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/432 , G06F16/483
Abstract: 本公开关于一种视频合成方法、装置、电子设备及计算机可读存储介质,属于视频处理技术领域。所述方法包括:获取与第一多媒体文件组合能够表达目标主题的第二多媒体文件;响应于第一多媒体文件和第二多媒体文件组合在表达目标主题过程中的表现相匹配,将第一多媒体文件和第二多媒体文件合成目标视频。本公开基于目标主题,获取第二多媒体文件,进而将第二多媒体文件与第一多媒体文件合成目标视频。由于该目标主题并没有特定的应用场景,用户可根据实际的需求进行设置,且所合成的目标视频不仅能够表达目标主题,而且在表达目标主题时自然、不违和,因而在确保合成符合主题需要的视频的前提下,扩大了视频合成方法的应用范围。
-
公开(公告)号:CN114187919A
公开(公告)日:2022-03-15
申请号:CN202111499834.8
申请日:2021-12-09
Applicant: 北京达佳互联信息技术有限公司
IPC: G10L21/007 , G10L15/26 , G06F40/289
Abstract: 本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取待处理语音的初始分词和音乐伴奏的伴奏节奏时间戳;所述初始分词为所述待处理语音的语音识别词;根据所述伴奏节奏时间戳,对所述初始分词进行更新,得到所述待处理语音的目标分词;将所述目标分词的分词时间戳和伴奏节奏时间戳进行时间对齐处理,得到所述目标分词的分词时间戳和所述伴奏节奏时间戳之间的目标对应关系;根据所述待处理语音、所述音乐伴奏和所述目标对应关系,生成所述待处理语音对应的音乐。采用本方法,有利于提高生成的音乐的音乐效果。
-
公开(公告)号:CN112528049A
公开(公告)日:2021-03-19
申请号:CN202011494362.2
申请日:2020-12-17
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/432 , G06F16/483
Abstract: 本公开关于一种视频合成方法、装置、电子设备及计算机可读存储介质,属于视频处理技术领域。所述方法包括:获取与第一多媒体文件组合能够表达目标主题的第二多媒体文件;响应于第一多媒体文件和第二多媒体文件组合在表达目标主题过程中的表现相匹配,将第一多媒体文件和第二多媒体文件合成目标视频。本公开基于目标主题,获取第二多媒体文件,进而将第二多媒体文件与第一多媒体文件合成目标视频。由于该目标主题并没有特定的应用场景,用户可根据实际的需求进行设置,且所合成的目标视频不仅能够表达目标主题,而且在表达目标主题时自然、不违和,因而在确保合成符合主题需要的视频的前提下,扩大了视频合成方法的应用范围。
-
-
-
-
-
-
-