-
公开(公告)号:CN110941727B
公开(公告)日:2023-09-29
申请号:CN201911204911.5
申请日:2019-11-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06F16/45 , G06F16/483 , G06N3/0464 , G06N3/0985
Abstract: 本公开是关于一种资源推荐方法、装置、电子设备及存储介质,该方法包括:获取用户输入的属于第一类别的第一资源;根据预先训练的匹配度确定模型中的第一子模型,对第一资源进行特征提取,得到第一资源的第一特征向量,计算根据第二子模型得到的预设各第二资源各自的第二特征向量,与第一特征向量的匹配度,基于计算得到的各匹配度,向用户推荐资源,基于上述处理,能够提高推荐资源的有效性。
-
公开(公告)号:CN112037814B
公开(公告)日:2024-01-30
申请号:CN202010845686.X
申请日:2020-08-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。
-
公开(公告)号:CN112037814A
公开(公告)日:2020-12-04
申请号:CN202010845686.X
申请日:2020-08-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。
-
公开(公告)号:CN109599128A
公开(公告)日:2019-04-09
申请号:CN201811583191.3
申请日:2018-12-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请是关于一种语音情感识别方法、语音识别装置、电子设备和可读介质。该语音情感识别方法将待检测语音段输入到语音情感识别模型中,得到情感标签序列,将情感标签序列包含的情感标签按照出现次数进行排序;并采用出现次数大于预设值的情感标签作为待检测语音段的情感标签。该实施例能够输出细粒度的情感标签序列,从而能够细粒度地刻画情感信息的时序性,并提高语音情感识别模型的精度。
-
公开(公告)号:CN114022822A
公开(公告)日:2022-02-08
申请号:CN202111347956.5
申请日:2021-11-15
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开涉及一种视频配乐的获取方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该方法包括:获取视频中的视频帧,并识别所述视频帧中的主体内容;根据所述视频帧中的主体内容确定所述视频中的关键帧,并根据所述关键帧的主体内容确定所述关键帧的主体内容属性;根据所述关键帧的所述主体内容和所述主体内容属性得到所述视频的语义特征向量;将所述视频的语义特征向量与预先建立的歌词向量检索池中的歌词语义特征向量进行匹配,并根据匹配结果得到所述视频的配乐候选集合。本公开通过视频的主体内容及主体内容属性匹配对应的视频配乐,可以提高所推荐的视频配乐与视频内容的匹配程度。
-
公开(公告)号:CN110941727A
公开(公告)日:2020-03-31
申请号:CN201911204911.5
申请日:2019-11-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06F16/45 , G06F16/483 , G06N3/04 , G06N3/08
Abstract: 本公开是关于一种资源推荐方法、装置、电子设备及存储介质,该方法包括:获取用户输入的属于第一类别的第一资源;根据预先训练的匹配度确定模型中的第一子模型,对第一资源进行特征提取,得到第一资源的第一特征向量,计算根据第二子模型得到的预设各第二资源各自的第二特征向量,与第一特征向量的匹配度,基于计算得到的各匹配度,向用户推荐资源,基于上述处理,能够提高推荐资源的有效性。
-
公开(公告)号:CN111080752B
公开(公告)日:2023-08-22
申请号:CN201911286226.1
申请日:2019-12-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开公开一种基于音频的动作序列生成方法、装置以及电子设备,涉及数据处理技术领域,包括:提取音频帧序列中各音频帧的特征分量,并确定音频帧序列中各音频帧的位置编码;将音频帧序列中各音频的特征分量以及位置编码依序输入给已训练的基于自注意力机制的模型进行处理,得到音频帧序列对应的动作序列。通过该方式可以获取与音频数据对应的动作序列,增加了音频数据对应动作序列的多样性。
-
公开(公告)号:CN114022822B
公开(公告)日:2025-04-11
申请号:CN202111347956.5
申请日:2021-11-15
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开涉及一种视频配乐的获取方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该方法包括:获取视频中的视频帧,并识别所述视频帧中的主体内容;根据所述视频帧中的主体内容确定所述视频中的关键帧,并根据所述关键帧的主体内容确定所述关键帧的主体内容属性;根据所述关键帧的所述主体内容和所述主体内容属性得到所述视频的语义特征向量;将所述视频的语义特征向量与预先建立的歌词向量检索池中的歌词语义特征向量进行匹配,并根据匹配结果得到所述视频的配乐候选集合。本公开通过视频的主体内容及主体内容属性匹配对应的视频配乐,可以提高所推荐的视频配乐与视频内容的匹配程度。
-
公开(公告)号:CN109599128B
公开(公告)日:2022-03-01
申请号:CN201811583191.3
申请日:2018-12-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请是关于一种语音情感识别方法、语音识别装置、电子设备和可读介质。该语音情感识别方法将待检测语音段输入到语音情感识别模型中,得到情感标签序列,将情感标签序列包含的情感标签按照出现次数进行排序;并采用出现次数大于预设值的情感标签作为待检测语音段的情感标签。该实施例能够输出细粒度的情感标签序列,从而能够细粒度地刻画情感信息的时序性,并提高语音情感识别模型的精度。
-
公开(公告)号:CN111080752A
公开(公告)日:2020-04-28
申请号:CN201911286226.1
申请日:2019-12-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开公开一种基于音频的动作序列生成方法、装置以及电子设备,涉及数据处理技术领域,包括:提取音频帧序列中各音频帧的特征分量,并确定音频帧序列中各音频帧的位置编码;将音频帧序列中各音频的特征分量以及位置编码依序输入给已训练的基于自注意力机制的模型进行处理,得到音频帧序列对应的动作序列。通过该方式可以获取与音频数据对应的动作序列,增加了音频数据对应动作序列的多样性。
-
-
-
-
-
-
-
-
-