-
公开(公告)号:CN114782236B
公开(公告)日:2024-12-27
申请号:CN202210307853.4
申请日:2022-03-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像水印嵌入、提取方法、装置、电子设备及介质,所述方法包括:在嵌入阶段,对待嵌入水印的图像中的局部区域进行评分处理,根据评分结果确定水印嵌入区域;对水印嵌入区域进行缩放与分块处理,得到多个第一分块区域;基于预设的边缘空域水印嵌入方法将待嵌入的水印嵌入到多个第一分块区域中,嵌入后并按预设的缩放比例进行缩放处理,得到含水印的图像;在提取阶段,按照与所述嵌入阶段相同的方法获取多个第三分块区域,基于预设的边缘空域水印提取方法从中提取水印。本发明提供的图像水印嵌入和提取方法能够充分利用图像的视觉特征调节水印的嵌入强度,可使水印具有良好的不可见性和鲁棒性,提升用户体验。
-
公开(公告)号:CN117059123A
公开(公告)日:2023-11-14
申请号:CN202310928326.X
申请日:2023-07-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于手势动作图的小样本数字人语音驱动动作重演方法,方法包括:对参考讲话数据进行节奏点检测、关键词检测和运动连续性检测,分别得到第一节奏点的位置、第一关键词和对应的位置和非自然帧间连续关系;基于第一节奏点位置、第一关键词和对应的位置以及非自然帧间连续关系,构建手势运动图;对测试讲话数据进行节奏点检测、关键词检测,分别得到第二节奏点位置、第二关键词和对应的位置;基于第二节奏点位置、第二关键词和对应的位置,确定搜索分段,并基于搜索分段得到重演手势;基于手势风格融合网络输出融合手势,基于融合手势和节奏性手势,确定最终手势,基于最终手势驱动数字人动作重演,提高了动作重演的准确性和可靠性。
-
公开(公告)号:CN115116453B
公开(公告)日:2023-09-12
申请号:CN202210605835.4
申请日:2022-05-30
Applicant: 中国科学院自动化研究所
IPC: G10L19/018
Abstract: 本发明提供一种音频水印的嵌入方法、装置、电子设备及存储介质,该方法包括:提取载体音频在时间域上的局部显著特征点;根据所述局部显著特征点,确定所述载体音频在时间域上的水印嵌入位置;基于所述水印嵌入位置,将水印信息嵌入在所述载体音频中,得到包括所述水印信息的载体音频。本发明实施例中,由于提取的载体音频的局部显著特征点处于音频信号变化剧烈的位置,基于这样的局部显著特征点确定的水印嵌入位置,在面对去同步攻击时能保持相对位置不变化,故可以准确定位水印信息嵌入的音频片段,进而可以正确提取嵌入在其中的水印信息,有效提升了水印技术在去同步攻击情形时的鲁棒性。
-
公开(公告)号:CN116524074A
公开(公告)日:2023-08-01
申请号:CN202310296375.6
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明实施例提供了一种数字人手势生成的方法、装置、设备和存储介质,该方法包括:获取待生成数字人手势的目标音频文件;基于脚本生成模型,确定所述目标音频文件对应的动作发生序列;基于所述动作发生序列以及手势生成模型,控制生成的代表性手势和节奏性手势合成为所述目标音频文件对应的数字人手势。本发明提供的方法通过由脚本生成模型确定的目标音频文件对应的动作发生序列,有效控制同步语音下的数字人手势合成,将手势解耦并建模得到代表性手势生成模型和节奏性手势生成模型,结合手势生成模型分别得到的代表性手势和节奏性手势,可以生成更自然且丰富的手势,使数字人手势的效果更真实。
-
公开(公告)号:CN113792547A
公开(公告)日:2021-12-14
申请号:CN202110860072.3
申请日:2021-07-28
Applicant: 中国科学院自动化研究所
IPC: G06F40/289 , G06F40/216 , G06F16/9535 , G06F16/783
Abstract: 本发明提供一种影视作品选角方法及系统,首先获取待选角影视作品的角色需求文本信息;然后将所述角色需求文本信息与预先确定的演员全量个性化标签库中各演员的个性化特征文本信息进行匹配,得到匹配结果;最后基于所述匹配结果,对所述待选角影视作品进行选角。能够面向影视作品,辅助相关人员自动化智能化精准化选角,提高选角的效率与效果,有助于辅助现有人工选角,避免选角过程中的资源不合理配置导致的资源浪费,提高生产力。
-
公开(公告)号:CN113705873A
公开(公告)日:2021-11-26
申请号:CN202110948252.7
申请日:2021-08-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种影视作品评分预测模型的构建方法及评分预测方法,构建方法包括:采集影视平台上的视频的属性数据;去除属性数据中与视频评分的相关性小于相关性阈值下限的数据,得到保留数据项;将保留数据项中数据间的相关性大于相关性阈值上限的数据按照合并规则进行合并;将经合并处理后的数据与保留数据项中原有的小于相关性阈值上限的数据拼接构造视频的特征向量;对特征向量进行独热编码,并与保留数据项中原有的小于相关性阈值上限的数据拼接后,输入预设的模型内训练得到评分预测模型。该方法能对数据集所在的电影平台用户的视频评分数据进行较为准确的预测,为影视行业投资提供一种科学的预测方式。
-
公开(公告)号:CN113487476A
公开(公告)日:2021-10-08
申请号:CN202110558894.6
申请日:2021-05-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种在线更新的图像盲超分辨率重建方法和装置,其中方法包括:初始化学习网络中的降质估计模块和超分重建模块;每隔一个学习周期,将待重建图像输入至超分重建模块进行超分辨率重建,得到多个候选超分重建图像;基于多个候选超分重建图像的视觉效果,确定待重建图像的超分重建图像;其中,在每一学习周期内,交替优化降质估计模块和超分重建模块,以学习待重建图像的降质方式,并学习基于降质方式进行超分辨率重建。本发明不依赖于低分辨率‑高分辨率样本对,能够根据不同低分辨率测试图片的降质方式进行模型参数优化,获得特定于测试图片降质方式的模型,从而对待重建图像进行针对性地超分重建,提高了超分辨率重建的效果和鲁棒性。
-
公开(公告)号:CN113160341A
公开(公告)日:2021-07-23
申请号:CN202110458638.X
申请日:2021-04-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于数据增强技术领域,具体涉及了一种含有目标物品的X光图像生成方法、系统及设备,旨在解决X光图像真实数据不足的问题。所述方法包括:获取目标物品真实图像和不含目标物品的X光图像;将所述目标物品真实图像输入至生成式对抗网络模型中得到目标物品合成图像;对所述目标物品合成图像进行预处理得到目标物品中间图像;将所述目标物品中间图像按照预设规则融入所述不含目标物品的X光图像,得到含有目标物品的X光生成图像。本发明增加了数据集的多样性,为后续检测模型的泛化性提供数据基础,有效地解决了X光图像数据不足的问题。
-
公开(公告)号:CN112884085A
公开(公告)日:2021-06-01
申请号:CN202110360744.4
申请日:2021-04-02
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉目标检测与识别领域,具体涉及了一种基于X光图像的违禁物品检测识别的方法、系统及设备。所述方法包括:根据预设违禁品细化类别信息确定目标图像集;对所述目标图像集进行数据源扩充预处理得到训练图像集;将所述训练图像集输入至检测识别训练模型进行训练以得到检测识别网络模型;将待检测X光图像输入至所述检测识别网络模型得到待检测X光图像中各检测区域的置信度检测值;将在预设置信区间的置信度检测值对应的检测区域确定为违禁品区域。本发明大大提高了检测准确率。
-
公开(公告)号:CN106650751B
公开(公告)日:2020-07-28
申请号:CN201611056326.1
申请日:2016-11-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种图像特征提取方法及数字媒体版权管理方法。所述图像特征提取方法包括:判断图像是否经历过几何变换,对经历过几何变换的图像进行校正;对图像进行一次尺寸标准化;对一次尺寸标准化后的图像进行规范化操作以及再次尺寸标准化;对规范化后的图像提取特征。所述数字媒体版权管理方法包括:获取数字媒体的版权信息;采用所述图像特征提取方法提取其特征序列;将版权信息与特征序列在数据库中进行对应的登记注册;利用登记注册信息进行数字媒体的版权管理。本发明提高了图像特征提取过程中抵抗常见图像处理攻击和几何攻击的能力,适用于基于图像特征的多媒体检索等领域,并为数字媒体版权管理模式提供了一种新的解决方案和途径。
-
-
-
-
-
-
-
-
-