一种混响消除方法及装置
    71.
    发明授权

    公开(公告)号:CN112289334B

    公开(公告)日:2021-04-02

    申请号:CN202011588741.8

    申请日:2020-12-29

    Abstract: 本申请涉及语音处理技术领域,公开了一种混响消除方法及装置,用以解决难以消除混响时间较长的语音信号的问题。该方法包括:生成音频对应的声谱图和相位谱图,声谱图上的每一帧对应一个语音信号组;对各帧进行特征提取得到对应的语音特征,并确定各个语音特征的上下文关联向量;再基于各个语音特征以及对应的上下文关联向量,确定出声谱图上各个语音信号的语音掩蔽估计值,并根据各个语音掩蔽估计值对声谱图执行消除混响操作,得到去混响的声谱图;最后利用去混响的声谱图和相位谱图得到去混响的音频。通过对输入的语音特征图添加注意力,可以使得语音特征图上的语音特征以干净语音信息或者混响语音信息为主导,从而区分干净语音和混响语音。

    一种音频分类方法、装置及存储介质

    公开(公告)号:CN112380382A

    公开(公告)日:2021-02-19

    申请号:CN202011324279.0

    申请日:2020-11-23

    Inventor: 张文文 李岩 姜涛

    Abstract: 本申请公开了一种音频分类方法、装置及存储介质,涉及音频处理领域,以挖掘出当前最新的,播放热度高的歌曲。该方法中,通过目标音频的音频指纹获取对应的音频检索资源,并将目标指纹分别与对应的音频检索资源进行指纹匹配,从而得到目标指纹的待分类音频集合。将目标音频与待分类音频集合中的各待分类音频进行分类,得到分类结果。这样,通过对目标音频的音频分类,可以得到目标音频分类后的音频,从而在较多的音频内容中,提高音频分类的准确性。

    语种识别方法、装置、服务器及存储介质

    公开(公告)号:CN112185347A

    公开(公告)日:2021-01-05

    申请号:CN202011033457.4

    申请日:2020-09-27

    Abstract: 本公开关于一种语种识别方法、装置、服务器及存储介质,该方法包括:获取待检测音频信号中的声学特征;将声学特征输入预先训练的声纹特征提取网络模型中,得到预先训练的声纹特征提取网络模型中目标神经网络层输出的特征,作为待检测音频信号中的声纹特征;根据待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定待检测音频信号与各个预设语种音频信号之间的对数似然比值;根据各个对数似然比值,确定待检测音频信号与各个预设语种音频信号之间的特征相似度;根据特征相似度,从各个预设语种音频信号对应的语种信息中,确定待检测音频信号的语种信息。采用本方法,有利于提高语种识别的准确度。

    多音轨序列生成方法、装置、设备及存储介质

    公开(公告)号:CN109616090B

    公开(公告)日:2020-12-18

    申请号:CN201811584207.2

    申请日:2018-12-24

    Inventor: 姜涛 李岩

    Abstract: 本公开是关于一种多音轨序列生成方法、装置、设备及存储介质,属于互联网技术领域,该方法包括:生成与原始音频对应的第一旋律单元序列;获取预设数据库,预设数据库中包括乐理知识规则以及多个模板数据;根据第一旋律单元序列与多个模板数据之间的匹配度,从预设数据库中获取与第一旋律单元序列匹配的模板数据;根据第一旋律单元序列匹配的模板数据,得到第二旋律单元序列;将第一旋律单元序列和第二旋律单元序列进行合成,得到多音轨的第三旋律单元序列。本公开利用乐理知识规则生成与原始音频匹配的多音轨旋律单元序列,从而得到了与原始音频匹配的音乐作品,提高了音乐作品的多样性和表现能力,增强了趣味性,更好的满足了用户的需求。

    语音识别模型的训练、语音识别方法、装置、设备及介质

    公开(公告)号:CN111951789A

    公开(公告)日:2020-11-17

    申请号:CN202010821094.4

    申请日:2020-08-14

    Inventor: 李杰 王晓瑞 李岩

    Abstract: 本公开实施例关于一种语音识别模型的训练、语音识别方法、装置、设备及介质。所述语音识别模型的训练方法包括:获取第一语音数据;将所述第一语音数据输入至第一语音识别模型中,获取所述语音识别模型输出的至少一个第一文本数据;按照预设语法规则,从各所述第一文本数据中识别出第二文本数据,并根据所述第一语音数据,生成第一语音识别样本;获取第二语音识别样本;将所述第一语音识别样本和所述第二语音识别样本输入至所述第一语音识别模型中,对所述第一语音识别模型继续进行训练,生成第二语音识别模型。本公开实施例可以提高训练数据的生成效率,加快语音识别模型的训练速度,提高语音识别模型的语音识别准确率。

    一种内容搜索的方法及装置

    公开(公告)号:CN111881349A

    公开(公告)日:2020-11-03

    申请号:CN202010699772.4

    申请日:2020-07-20

    Abstract: 本申请涉及计算机技术领域,公开了一种内容搜索的方法及装置,用以提高搜索准确度。该方法包括:根据接收到的账号的搜索信息,获取账号对应的至少一组资源关联信息,每组资源关联信息包括分别利用搜索信息、账号的账号信息和账号对应的一个候选资源信息进行特征提取得到的资源关联信息;再对每组资源关联信息分别进行特征拼接,得到多个交叉特征信息,基于各个交叉特征信息,分别确定对应的第一关联度特征和第二关联度特征,并基于各个第一关联度特征和对应的第二关联度特征,确定账号与各个候选资源信息的预测相关度;基于各个预测相关度对各个候选资源信息进行排序。综合考虑搜索信息、账号信息与候选资源信息,有利于提高预测准确率。

    音频文件的原唱检测方法、装置、服务器及存储介质

    公开(公告)号:CN111508506A

    公开(公告)日:2020-08-07

    申请号:CN202010259245.1

    申请日:2020-04-03

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开关于一种音频文件的原唱检测方法、装置、服务器及存储介质,该方法包括:提取待检测音频文件的音频指纹,根据待检测音频文件的音频指纹,确定与待检测音频文件对应的歌曲音频文件;从待检测音频文件中分离出人声音频;分别提取人声音频的音频指纹和歌曲音频文件的音频指纹;根据人声音频的音频指纹和歌曲音频文件的音频指纹,确定对待检测音频文件的原唱检测结果。采用本方法,综合考虑了待检测音频文件中的人声音频的音频指纹以及与待检测音频文件对应的歌曲音频文件的音频指纹,避免了仅仅考虑待检测音频文件中的音频指纹,导致确定出的原唱检测结果的准确率较低的缺陷,从而提高了音频文件的原唱检测准确率。

    面部识别方法及装置、电子设备及存储介质

    公开(公告)号:CN111401283A

    公开(公告)日:2020-07-10

    申请号:CN202010209378.8

    申请日:2020-03-23

    Inventor: 张水发 李岩

    Abstract: 本公开提供了一种面部识别方法及装置、电子设备及存储介质,涉及网络技术领域,以解决相关技术中由于获取的面部图像不完整,导致面部识别的准确率较低的问题。该方法包括:获取第一面部图像,第一面部图像为用户的部分面部图像;根据第一面部图像,生成第二面部图像,第二面部图像为用户的完整面部图像;采用第二面部图像,进行面部识别。该方法可以应用于面部识别的场景中。

    视频播放的方法、装置、终端设备及服务器

    公开(公告)号:CN111355999A

    公开(公告)日:2020-06-30

    申请号:CN202010181013.9

    申请日:2020-03-16

    Inventor: 李岩 张水发 苏眉

    Abstract: 本公开关于一种视频播放的方法、装置、终端设备及服务器,该方法包括:响应用户账号的视频播放操作,获取用户账号在候选视频中选定的目标视频的视频标识;向服务器发送视频播放请求,视频播放请求中携带有目标视频的视频标识;接收服务器发送的视频播放响应,视频播放响应中携带有目标视频的视频数据和目标视频包含的对象中与搜索词相匹配的目标对象的目标索引,目标索引包含目标对象所属的视频帧和目标对象的位置信息;播放目标视频,并在目标视频播放至目标对象所属的视频帧时,根据目标对象的位置信息,在目标对象所属的视频帧中对目标对象进行标记显示。采用本公开可以在视频中快速定位到与搜索词相匹配的图像。

    视频修复方法、装置、设备及存储介质

    公开(公告)号:CN110856048A

    公开(公告)日:2020-02-28

    申请号:CN201911150075.7

    申请日:2019-11-21

    Inventor: 张水发 李岩

    Abstract: 本公开关于一种视频修复方法、装置、设备及存储介质,属于多媒体技术领域,本实施例提供了一种能够修复视频的方法,通过对视频的视频摘要进行分辨率放大处理,来得到高分辨率的目标视频摘要,从目标视频摘要中,分别找到与视频的各帧图像相似的高分辨率图像,通过每帧高分辨率图像,来修复视频中对应的图像,那么通过修复视频的每帧图像,能够让整个视频得以修复。通过这种方法,充分利用高分辨率图像包含的信息,补充出视频原始的图像中受损的细节,从而将模糊的视频转换为清晰的视频,有效地提高了视频的质量。

Patent Agency Ranking