Patent search ap:("中国科学院自动化研究所") AND inv:"杨嵩林" Page 1

1.

发明公开
基于跨模态风格学习的图像生成方法及装置有权

公开(公告)号：CN117315090A

公开(公告)日：2023-12-29

申请号：CN202311265075.8

申请日：2023-09-27

Applicant: 中国科学院自动化研究所

Inventor： 董晶 , 王伟 , 彭勃 , 王建文 , 吕月明 , 江玥 , 杨嵩林

IPC: G06T11/60 , G06N3/094

Abstract: 本公开涉及一种基于跨模态风格学习的图像生成方法及装置，所述方法包括：通过预训练生成对抗网络生成目标生成图像，并对目标训练图像进行图像增强处理；将目标生成图像和处理后目标训练图像，输入对抗网络的判别器中，将判别器输出的目标特征，输入训练好的原型空间中，并根据原型空间的输出确定交换预测损失；获取目标训练图像和目标生成图像之间的原始对抗损失、源生成图像和目标生成图像之间的对比学习损失与文本指导损失，并根据所述损失确定微调损失；按照所述微调损失对对抗网络进行微调，得到微调后图像生成模型，通过图像生成模型生成与训练图像一致的图像，能够解决当前极少量样本下目标域风格学习不佳的问题。

2.

发明授权
基于跨模态风格学习的图像生成方法及装置有权

公开(公告)号：CN117315090B

公开(公告)日：2024-12-13

申请号：CN202311265075.8

申请日：2023-09-27

Applicant: 中国科学院自动化研究所

Inventor： 董晶 , 王伟 , 彭勃 , 王建文 , 吕月明 , 江玥 , 杨嵩林

IPC: G06T11/60 , G06N3/094

Abstract: 本公开涉及一种基于跨模态风格学习的图像生成方法及装置，所述方法包括：通过预训练生成对抗网络生成目标生成图像，并对目标训练图像进行图像增强处理；将目标生成图像和处理后目标训练图像，输入对抗网络的判别器中，将判别器输出的目标特征，输入训练好的原型空间中，并根据原型空间的输出确定交换预测损失；获取目标训练图像和目标生成图像之间的原始对抗损失、源生成图像和目标生成图像之间的对比学习损失与文本指导损失，并根据所述损失确定微调损失；按照所述微调损失对对抗网络进行微调，得到微调后图像生成模型，通过图像生成模型生成与训练图像一致的图像，能够解决当前极少量样本下目标域风格学习不佳的问题。

3.

发明授权
人脸活体检测对抗鲁棒性的评估方法及装置有权

公开(公告)号：CN114241587B

公开(公告)日：2022-05-24

申请号：CN202210165316.0

申请日：2022-02-23

Applicant: 中国科学院自动化研究所

Inventor： 王伟 , 董晶 , 彭勃 , 杨嵩林 , 王建文

IPC: G06V40/16 , G06V40/40 , G06V10/774

Abstract: 本公开涉及一种人脸活体检测对抗鲁棒性的评估方法及装置、电子设备及计算机设备，所述方法包括：将原始人脸图像输入预先训练好的语义特征增广网络，输出噪声特征；将原始人脸图像输入预先训练好的多任务网络模型，输出多个分支特征向量；根据所述噪声特征、所述多个分支特征向量和原始人脸图像生成多个分支对抗样本；将原始人脸图像和多个分支对抗样本分别输入预先训练好的骨干网络，输出对应的原始检测准确率以及对抗检测准确率；根据两者之间的差值确定各分支特征的对抗鲁棒性，细粒度对抗样本包括噪声特征和分支特征向量，能够利用细粒度对抗样本从多个干扰特征中选出对骨干网络的人脸活体检测准确率重要的特征。

4.

发明授权
说话人视频的编辑帧生成方法、装置、电子设备及介质有权

公开(公告)号：CN117156081B

公开(公告)日：2024-03-01

申请号：CN202311418899.4

申请日：2023-10-30

Applicant: 中国科学院自动化研究所

Inventor： 王伟 , 董晶 , 彭勃 , 杨嵩林 , 吕月明

IPC: H04N5/265 , H04N21/234 , H04N21/44

Abstract: 本发明实施例涉及一种说话人视频的编辑帧生成方法、装置、电子设备及介质，通过确定原说话人视频的编辑点，以及围绕所述编辑点的目标语音片段和视频帧序列；提取所述目标语音片段的语音特征序列，提取所述第一上下文视频帧的动作特征，并赋予所述待编辑帧动作特征初始值构成所述视频帧序列的第一动作特征序列；将所述语音特征序列和第一动作特征序列拼接后输入到训练好的动作预测模型中，预测出所述目标语音片段驱动的视频帧序列的第二动作特征序列，并从中提取出所述待编辑帧对应的动作特征；将第一上下文视频帧和待编辑帧对应的动作特征输入到训练好的神经渲染模型中，对所述待编辑帧进行渲染，得到目标编辑帧；实现高效、平滑地生成视频帧。

5.

发明公开
说话人视频的编辑帧生成方法、装置、电子设备及介质有权

公开(公告)号：CN117156081A

公开(公告)日：2023-12-01

申请号：CN202311418899.4

申请日：2023-10-30

Applicant: 中国科学院自动化研究所

Inventor： 王伟 , 董晶 , 彭勃 , 杨嵩林 , 吕月明

IPC: H04N5/265 , H04N21/234 , H04N21/44

Abstract: 本发明实施例涉及一种说话人视频的编辑帧生成方法、装置、电子设备及介质，通过确定原说话人视频的编辑点，以及围绕所述编辑点的目标语音片段和视频帧序列；提取所述目标语音片段的语音特征序列，提取所述第一上下文视频帧的动作特征，并赋予所述待编辑帧动作特征初始值构成所述视频帧序列的第一动作特征序列；将所述语音特征序列和第一动作特征序列拼接后输入到训练好的动作预测模型中，预测出所述目标语音片段驱动的视频帧序列的第二动作特征序列，并从中提取出所述待编辑帧对应的动作特征；将第一上下文视频帧和待编辑帧对应的动作特征输入到训练好的神经渲染模型中，对所述待编辑帧进行渲染，得到目标编辑帧；实现高效、平滑地生成视频帧。

6.

发明公开
人脸活体检测对抗鲁棒性的评估方法及装置有权

公开(公告)号：CN114241587A

公开(公告)日：2022-03-25

申请号：CN202210165316.0

申请日：2022-02-23

Applicant: 中国科学院自动化研究所

Inventor： 王伟 , 董晶 , 彭勃 , 杨嵩林 , 王建文

IPC: G06V40/16 , G06V40/40 , G06V10/774

Abstract: 本公开涉及一种人脸活体检测对抗鲁棒性的评估方法及装置、电子设备及计算机设备，所述方法包括：将原始人脸图像输入预先训练好的语义特征增广网络，输出噪声特征；将原始人脸图像输入预先训练好的多任务网络模型，输出多个分支特征向量；根据所述噪声特征、所述多个分支特征向量和原始人脸图像生成多个分支对抗样本；将原始人脸图像和多个分支对抗样本分别输入预先训练好的骨干网络，输出对应的原始检测准确率以及对抗检测准确率；根据两者之间的差值确定各分支特征的对抗鲁棒性，细粒度对抗样本包括噪声特征和分支特征向量，能够利用细粒度对抗样本从多个干扰特征中选出对骨干网络的人脸活体检测准确率重要的特征。

Patent Agency Ranking