-
公开(公告)号:CN117611938A
公开(公告)日:2024-02-27
申请号:CN202311371318.6
申请日:2023-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22
Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型,将图文对齐模型得到的视觉表达信息输入大型语言模型中,提高了多模态信息的对齐效果,使得多模态模型对于图像视觉信息的理解能力得到提升。
-
公开(公告)号:CN114817636A
公开(公告)日:2022-07-29
申请号:CN202210469600.7
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/783 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种视频检测方法、装置、设备及计算机可读存储介质,该方法包括:获取待检测视频的多种特征信息;基于所述多种特征信息,生成所述待检测视频的融合特征信息;基于所述待检测视频的融合特征信息,对所述待检测视频的安全性进行检测,得到检测结果。本公开通过充分利用视频数据中的多种模态维度的特征信息得到视频的融合特征信息,根据融合特征信息对待检测视频内容进行检测,能够发现各模态维度信息之间关联而形成的隐性安全问题,大大提高了视频检测方法的准确性。
-
公开(公告)号:CN114495245B
公开(公告)日:2022-07-29
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN114495245A
公开(公告)日:2022-05-13
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN113766314B
公开(公告)日:2022-03-04
申请号:CN202111317971.5
申请日:2021-11-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/44 , H04N21/439 , H04N21/488 , G06V20/40 , G06V20/62 , G06V10/44 , G06K9/62
Abstract: 本公开涉及一种视频切分方法、装置、设备、系统及存储介质,该方法包括:获取目标视频的视频特征数据,视频特征数据包括音频数据、字幕数据和镜头数据;对音频数据进行切分,得到多个音频数据片段;基于镜头数据对字幕数据进行切分,得到多个字幕子数据;基于音频数据片段和字幕子数据对目标视频进行切分,得到多个视频片段。根据本公开实施例,实现了能够准确的切分目标视频,以进一步使得用户通过浏览目标视频切分后的视频片段,从目标视频中快速获取准确的信息,以准确且快速的浏览目标视频中所包含的信息。
-
-
-
-