一种基于神经网络的单人换脸短视频的识别方法和系统

    公开(公告)号:CN113014914A

    公开(公告)日:2021-06-22

    申请号:CN202110109910.3

    申请日:2021-01-27

    Abstract: 本申请提供一种基于神经网络的单人换脸短视频的识别方法和系统。所述识别方法包括:从待识别单人短视频中抽取出单帧图像后,提取每个单帧图像中人脸区域对应的面部图像,利用神经网络模型确定面部图像经过面部修正的伪造概率,最后根据伪造概率大于预设伪造判定阈值的伪造图像的数量、每个面部图像的伪造概率以及多个预设阈值,确定待识别单人短视频的视频换脸概率。如此,仅对视频中部分单帧图像进行识别,提高了识别效率;同时,并不是一概而论地直接将所有面部图像的伪造概率的平均值作为视频换脸概率,而是根据伪造图像数量以及每个面部图像伪造概率的不同情况确定视频换脸概率,与待识别单人短视频的真实情景更为贴合,识别的准确性较高。

    一种高精度分布式显控帧同步方法和系统

    公开(公告)号:CN110475137B

    公开(公告)日:2021-05-14

    申请号:CN201910847059.7

    申请日:2019-09-06

    Abstract: 本发明提供了一种高精度分布式显控帧同步方法和系统,包括:对分布式拼接显示系统中的多个分布式输出节点进行网络时间同步操作;获取分布式拼接显示系统的预设帧率,以及根据预设帧率确定待同步相位;调整多个分布式输出节点之间的同步信号的相位与待同步相位一致;分别获取主节点的当前显示帧的第一时间戳信息、第一同步信号的第一时间信息,和每个从节点的第二时间戳信息、第二同步信号的第二时间信息;确定每个从节点与主节点之间的同一帧的时间偏移信息;基于时间偏移信息和预设帧率之间的关系,对每个从节点相对于主节点进行帧同步操作。本发明缓解了现有技术中存在的对网络要求高,灵活性差,同步精度低的技术问题。

    一种基于FPGA平台的视频OSD菜单图像叠加方法

    公开(公告)号:CN115379148B

    公开(公告)日:2024-06-07

    申请号:CN202110534709.X

    申请日:2021-05-17

    Abstract: 本申请提供一种基于FPGA平台的视频OSD菜单图像叠加方法。所述方法包括:利用预设的高速视频图像接口获取与待叠加图像一一对应的OSD菜单图像,将分辨率调整后的中间OSD图像与对应的待叠加图像进行像素点对齐,如果中间OSD图像中任一候选像素点的候选亮度值大于预设阈值,则将待叠加图像中与候选像素点位置相同的像素点与候选像素点进行叠加,得到候选位置对应的输出像素点,最终所有候选位置对应的输出像素点构成目标播放时间点对应的输出图像。如此,本申请中OSD视频传输速度较快,同时无需复杂的数据解析,出错率较低,可以较好地实现动态或复杂OSD菜单图像与目标视频各种方式的叠加,显示画面不易卡顿,稳定性较高。

    一种面部筛选方法、装置、设备及存储介质

    公开(公告)号:CN113569694B

    公开(公告)日:2024-03-19

    申请号:CN202110831104.7

    申请日:2021-07-22

    Abstract: 本申请提供了一种面部筛选方法、装置、设备及存储介质,应用于视觉图像处理技术领域,该方法根据人脸检测模型,对任意面部图像的特征点做仿射变换,得到目标面部图像;根据面部清晰度评价算法,计算目标面部图像中的特征参数;针对目标面部图像每个像素做归一化处理,得到新面部图像;针对新面部图像的每个像素,根据该像素的中心位置,计算该像素值与8个方向相邻像素的像素值乘积;根据8个方向全部像素的特征参数,训练出新面部图像在机器学习模型中的训练参数;将分辨率、面部完整度和目标面部图像是否正为面部姿态的结果,以及机器学习模型的训练参数按照面部图像指标进行匹配;若匹配符合预设要求,则将目标面部图像确定为人脸识别样本。

    一种基于FPGA的多平台视音频的同网传输系统及方法

    公开(公告)号:CN116016462A

    公开(公告)日:2023-04-25

    申请号:CN202211597234.X

    申请日:2022-12-12

    Abstract: 本申请提供了一种基于FPGA的多平台视音频的同网传输系统及方法,视音频编码模块用于将视音频信号发送至相对应的现场可编程门阵列以及处理器,基于现场可编程门阵列以及处理器对视音频信号进行压缩编码处理,生成目标压缩码流,将压缩编码处理后的视音频信号发送至交换机;交换机,用于通过第一网口接收目标压缩码流,通过第二网口将目标压缩码流发送至视音频解码模块;视音频解码模块,用于将目标压缩码流发送至相对应的现场可编程门阵列以及处理器,基于现场可编程门阵列以及处理器对目标压缩码流进行压缩解码处理,生成解码后的码流。可实现多平台视音频码流同网传输,通过一个网口与交换机连接,减少了交换机的数量也有效降低了系统成本。

    一种基于人工智能的广播电视新闻拆条方法及装置

    公开(公告)号:CN115497017A

    公开(公告)日:2022-12-20

    申请号:CN202110680476.4

    申请日:2021-06-18

    Abstract: 本申请提供一种基于人工智能的广播电视新闻拆条方法及装置。所述方法包括:从待拆条新闻视频中抽取关键帧图像,并提取各个关键帧图像中的人物信息后,将每个关键帧图像中的人物信息与获取的拆条模板图像中的目标人物信息作比对,将人物信息符合目标人物信息的关键帧图像对应的时间点确定为拆条时间点,最终按照所有拆条时间点对待拆条新闻视频进行拆分,得到拆分后的多个初始视频段落。如此,本申请中利用人物信息的变化来反映新闻事件的变化,按照预设的拆条模板图像对待拆条新闻视频进行自动拆条,拆条效率较高。

    一种基于特征的视音频检索方法
    49.
    发明公开

    公开(公告)号:CN115495600A

    公开(公告)日:2022-12-20

    申请号:CN202110608505.6

    申请日:2021-06-01

    Abstract: 本申请涉及音视频检索技术领域,提供一种基于特征的视音频检索方法,通过预先建立图像素材库以及预先建立音频素材库,对待检测样本进行索引,例如,可针对广播电视节目广告播出进行精准的监控统计,广播电视播出广告具有不变性特点,基于该方法提取各电视频道的特征构建素材特征库,然后基于广告样本特征检索,统计广告播出情况。基于特征的毫秒级特点,可对广告进行精准定位及查看。通过构建的素材特征库,可重复对不同待检测样本进行检索。基于时间连续性判断输出检索结果。特征ID根据节目ID和特征时间生成,可快速对检索的媒资进行分组,可精确到毫秒级的精准定位,精确匹配节目中素材出现的位置,且可对素材进行反复追溯检索。

    一种基于神经网络的单人换脸短视频的识别方法和系统

    公开(公告)号:CN113014914B

    公开(公告)日:2022-11-01

    申请号:CN202110109910.3

    申请日:2021-01-27

    Abstract: 本申请提供一种基于神经网络的单人换脸短视频的识别方法和系统。所述识别方法包括:从待识别单人短视频中抽取出单帧图像后,提取每个单帧图像中人脸区域对应的面部图像,利用神经网络模型确定面部图像经过面部修正的伪造概率,最后根据伪造概率大于预设伪造判定阈值的伪造图像的数量、每个面部图像的伪造概率以及多个预设阈值,确定待识别单人短视频的视频换脸概率。如此,仅对视频中部分单帧图像进行识别,提高了识别效率;同时,并不是一概而论地直接将所有面部图像的伪造概率的平均值作为视频换脸概率,而是根据伪造图像数量以及每个面部图像伪造概率的不同情况确定视频换脸概率,与待识别单人短视频的真实情景更为贴合,识别的准确性较高。

Patent Agency Ranking