-
公开(公告)号:CN109840509B
公开(公告)日:2020-12-01
申请号:CN201910119305.7
申请日:2019-02-15
Applicant: 北京工业大学
Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D‑S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。
-
公开(公告)号:CN111160110A
公开(公告)日:2020-05-15
申请号:CN201911244819.1
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于人脸特征和声纹特征识别主播的方法及装置,其中方法包括:根据预先训练的神经网络模型,从直播视频中提取待识别主播的身份特征,根据局部敏感哈希方法将所述身份特征存储至预先生成的哈希桶中,将与所述身份特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的身份特征;计算所述样本主播的身份特征与所述待识别主播的身份特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN111178146A
公开(公告)日:2020-05-19
申请号:CN201911243502.6
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于人脸特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取帧图像,将所述帧图像输入至预先训练的神经网络模型,根据所述神经网络模型的输出获得所述待识别主播的人脸特征;根据局部敏感哈希方法将所述人脸特征存储至预先生成的哈希桶中,将与所述人脸特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的人脸特征;计算所述样本主播的人脸特征与所述待识别主播的人脸特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN109492124A
公开(公告)日:2019-03-19
申请号:CN201811397237.2
申请日:2018-11-22
Applicant: 北京工业大学
IPC: G06F16/60
Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。
-
公开(公告)号:CN111128196B
公开(公告)日:2022-08-09
申请号:CN201911243498.3
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN109492124B
公开(公告)日:2022-03-25
申请号:CN201811397237.2
申请日:2018-11-22
Applicant: 北京工业大学
IPC: G06F16/60
Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。
-
公开(公告)号:CN113408412B
公开(公告)日:2024-05-24
申请号:CN202110677623.2
申请日:2021-06-18
Applicant: 北京工业大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种网络直播主播的行为识别方法、系统、设备及存储介质。该网络直播主播的行为识别方法包括:获取网络直播视频数据;利用时序评估模块检测网络直播视频数据中的主播时序动作,以生成第一主播动作序列数据;利用线性条件随机场推理主播动作序列,以生成第二主播动作序列数据;以及基于第二主播动作序列数据,利用多分类支持向量机进行主播行为识别与概要描述。
-
公开(公告)号:CN113408412A
公开(公告)日:2021-09-17
申请号:CN202110677623.2
申请日:2021-06-18
Applicant: 北京工业大学
Abstract: 本发明提供一种网络直播主播的行为识别方法、系统、设备及存储介质。该网络直播主播的行为识别方法包括:获取网络直播视频数据;利用时序评估模块检测网络直播视频数据中的主播时序动作,以生成第一主播动作序列数据;利用线性条件随机场推理主播动作序列,以生成第二主播动作序列数据;以及基于第二主播动作序列数据,利用多分类支持向量机进行主播行为识别与概要描述。
-
公开(公告)号:CN111128196A
公开(公告)日:2020-05-08
申请号:CN201911243498.3
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN109840509A
公开(公告)日:2019-06-04
申请号:CN201910119305.7
申请日:2019-02-15
Applicant: 北京工业大学
Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D-S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。
-
-
-
-
-
-
-
-
-