网络直播视频中不良主播的多层次协同识别方法及装置

    公开(公告)号:CN109840509B

    公开(公告)日:2020-12-01

    申请号:CN201910119305.7

    申请日:2019-02-15

    Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D‑S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。

    基于人脸特征和声纹特征识别主播的方法及装置

    公开(公告)号:CN111160110A

    公开(公告)日:2020-05-15

    申请号:CN201911244819.1

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于人脸特征和声纹特征识别主播的方法及装置,其中方法包括:根据预先训练的神经网络模型,从直播视频中提取待识别主播的身份特征,根据局部敏感哈希方法将所述身份特征存储至预先生成的哈希桶中,将与所述身份特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的身份特征;计算所述样本主播的身份特征与所述待识别主播的身份特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    基于人脸特征识别主播的方法及装置

    公开(公告)号:CN111178146A

    公开(公告)日:2020-05-19

    申请号:CN201911243502.6

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于人脸特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取帧图像,将所述帧图像输入至预先训练的神经网络模型,根据所述神经网络模型的输出获得所述待识别主播的人脸特征;根据局部敏感哈希方法将所述人脸特征存储至预先生成的哈希桶中,将与所述人脸特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的人脸特征;计算所述样本主播的人脸特征与所述待识别主播的人脸特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    选择性注意线索指导的不良主播检测方法、装置及电子设备

    公开(公告)号:CN109492124A

    公开(公告)日:2019-03-19

    申请号:CN201811397237.2

    申请日:2018-11-22

    Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。

    基于声纹特征识别主播的方法及装置

    公开(公告)号:CN111128196B

    公开(公告)日:2022-08-09

    申请号:CN201911243498.3

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    选择性注意线索指导的不良主播检测方法、装置及电子设备

    公开(公告)号:CN109492124B

    公开(公告)日:2022-03-25

    申请号:CN201811397237.2

    申请日:2018-11-22

    Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。

    网络直播主播的行为识别方法、系统、设备及存储介质

    公开(公告)号:CN113408412A

    公开(公告)日:2021-09-17

    申请号:CN202110677623.2

    申请日:2021-06-18

    Abstract: 本发明提供一种网络直播主播的行为识别方法、系统、设备及存储介质。该网络直播主播的行为识别方法包括:获取网络直播视频数据;利用时序评估模块检测网络直播视频数据中的主播时序动作,以生成第一主播动作序列数据;利用线性条件随机场推理主播动作序列,以生成第二主播动作序列数据;以及基于第二主播动作序列数据,利用多分类支持向量机进行主播行为识别与概要描述。

    基于声纹特征识别主播的方法及装置

    公开(公告)号:CN111128196A

    公开(公告)日:2020-05-08

    申请号:CN201911243498.3

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    网络直播视频中不良主播的多层次协同识别方法及装置

    公开(公告)号:CN109840509A

    公开(公告)日:2019-06-04

    申请号:CN201910119305.7

    申请日:2019-02-15

    Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D-S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。

Patent Agency Ranking