Patent search ap:("中国科学院自动化研究所") AND inv:"雷震" Page 1

1.

发明公开
透明视频的生成方法、装置、电子设备、存储介质和计算机程序产品审中-实审

公开(公告)号：CN119629433A

公开(公告)日：2025-03-14

申请号：CN202411708685.5

申请日：2024-11-26

Applicant: 中国科学院自动化研究所

Inventor： 雷震 , 杨阳 , 白景琦

IPC: H04N21/81 , H04N21/44 , H04N21/234 , G06N3/045 , H04N9/67

Abstract: 本公开关于透明视频的生成方法、装置、电子设备、存储介质和计算机程序产品，该方法包括：获取RGB视频序列和掩码图片序列；针对RGB视频序列所包含的除目标RGB图片之外的其他图片进行加噪；将加噪后的RGB视频序列和掩码图片序列输入透明编码器；将加噪后的RGB视频序列输入VAE编码器，获得RGB潜特征矩阵；计算第一透明潜特征矩阵和RGB潜特征矩阵的加和矩阵，并将加和矩阵输入扩散模型；基于中间加和元素(Xm)和其他加和元素(Xi)，生成透明视频。这样，本公开可以使用中间帧注意力机制为透明视频的生成过程提供先验信息，进而可以将视频帧内的内容信息、透明信息与动作信息进行解耦，可以保证生成透明区域准确、无伪影的透明视频。

2.

发明公开
手术辅助方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN118737391A

公开(公告)日：2024-10-01

申请号：CN202410665668.1

申请日：2024-05-27

Applicant: 中国科学院香港创新研究院人工智能与机器人创新中心有限公司 , 中国科学院自动化研究所

Inventor： 陈阵 , 吴锦林 , 刘宏斌 , 王金桥 , 雷震 , 骆行健

IPC: G16H30/40 , G16H20/40 , G06T11/60 , G06V10/80 , G06V10/82 , G06N3/0464

Abstract: 本发明提供一种手术辅助方法、装置、电子设备及存储介质，属于人工智能技术领域，包括：获取手术文本和手术图片；将手术文本输入至文本编码器获取文本令牌，并将手术图片输入至视觉编码器获取视觉令牌；将视觉令牌输入至路由投影器，获取由路由编码器输出的图片抽象特征；将图片抽象特征与所述文本令牌进行对齐拼接后生成的拼接特征向量输入至手术大语言模型，获取由手术大语言模型输出的手术辅助信息。本发明为了实现优越的手术多模态理解，引入路由投影器来投影来对齐手术图片与手术大语言模型，可以准确理解外科医生的意图，并根据需求完成一系列手术理解任务，从而在文本分析和视觉任务中取得突出的性能。

3.

发明授权
基于单张图像的三维人体重建方法及相关设备有权

公开(公告)号：CN117392326B

公开(公告)日：2024-09-20

申请号：CN202311490396.8

申请日：2023-11-09

Applicant: 中国科学院自动化研究所

Inventor： 张小梅 , 雷震 , 朱翔昱 , 徐淼 , 李豹

IPC: G06T17/00 , G06N3/0455 , G06T19/20 , G06V10/42 , G06V10/44 , G06V40/10

Abstract: 本发明提供一种基于单张图像的三维人体重建方法及相关设备，涉及图像处理技术领域，所述方法包括：将单张人体图像输入全局编码器，获取第一身体参数和全局二维特征；将第一手部特征、第一头部特征以及单张人体图像输入局部解码器，获取第一手部参数和第一头部参数；第一手部特征和所述第一头部特征是从全局二维特征中分离出来的；将第一身体参数、第一手部参数和第一头部参数输入部件交互模块进行部件交互，得到三维人体重建结果；部件交互模块用于基于第一身体参数、第一手部参数和第一头部参数进行身体、手部和头部之间的信息交互，以调整第一身体参数、第一手部参数和第一头部参数。本发明提高了三维人体重建结果的精度。

4.

发明授权
一种应用于自然图像的处理模型的搭建方法及装置有权

公开(公告)号：CN113627434B

公开(公告)日：2024-05-28

申请号：CN202110767565.2

申请日：2021-07-07

Applicant: 中国科学院自动化研究所

Inventor： 马喜波 , 刘宇浩 , 雷震

IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0985

Abstract: 本发明提供一种应用于自然图像的处理模型的搭建方法及装置，涉及深度学习技术领域，该方法包括以下步骤：采集自然图像，得到样本图像，并将样本图像作为数据集；对数据集进行分割，得到训练集和测试集；其中，训练集和测试集的交集为空集；为训练集补充三维信息，将二维图像数据映射成三维点云数据后作为训练使用的输入数据，采用深度学习方式进行训练，得到用于生成待识别自然图像的分类结果的处理模型，本发明通过为二维图像还原其三维原型来扩大特征嵌入空间，以同时结合全局和局部的特征进行快速的少样本学习和预测，可以在只有少量数据的情况下快速学习和预测，并且能结合多种的特征的特点，能更好地运用在自然图像分类方面。

5.

发明授权
一种小鼠行为量化分析方法、装置、设备及可读存储介质有权

公开(公告)号：CN113627255B

公开(公告)日：2024-05-24

申请号：CN202110767576.0

申请日：2021-07-07

Applicant: 中国科学院自动化研究所

Inventor： 马喜波 , 李晗 , 雷震

IPC: G06F30/27

Abstract: 本发明提供一种小鼠行为量化分析方法、装置、设备及可读存储介质，涉及动物行为分析技术领域，该方法包括以下步骤：采集小鼠的待预测视频；将待预测视频输入至姿态估计网络模型中，得到姿态估计网络模型输出的小鼠对应的姿态估计结果；将待预测视频和姿态估计结果输入至行为检测网络模型中，得到行为检测模型输出的小鼠对应的行为检测结果；基于姿态估计结果与行为检测结果提取小鼠的行为模式特征，根据行为模式特征对小鼠的行为进行量化分析。本发明基于动物姿态估计与行为检测提取多种小鼠行为模式特征，有利于实现更加准确与可靠的小鼠行为量化分析。

6.

发明授权
基于SlowFast的行为识别方法、系统及设备有权

公开(公告)号：CN113723169B

公开(公告)日：2024-04-30

申请号：CN202110455595.X

申请日：2021-04-26

Applicant: 中国科学院自动化研究所

Inventor： 马喜波 , 徐哲 , 雷震

IPC: G06F30/27

Abstract: 本发明属于行为识别技术领域，具体涉及了一种基于SlowFast的行为识别方法、系统及设备装置，旨在解决识别效率低以及识别精度低的问题。方法包括：对目标行为原始视频数据进行预处理得到预处理视频数据；将预处理视频数据划分为训练数据集和验证数据集；将训练数据集输入至预先构建的第一SlowFast神经网络识别模型中进行初步训练，得到第二SlowFast神经网络识别模型；根据验证数据集计算第二SlowFast神经网络识别模型的识别精度；根据识别精度调整第二SlowFast神经网络识别模型的参数，并进行迭代训练，得到第三SlowFast神经网络识别模型；利用第三SlowFast神经网络识别模型识别真实环境中的目标行为。本发明大大提高了识别效率，节省了人力和时间，并提高了识别精度。

7.

发明公开
文本生成图像的方法及装置审中-实审

公开(公告)号：CN117593419A

公开(公告)日：2024-02-23

申请号：CN202311352266.8

申请日：2023-10-18

Applicant: 中国科学院香港创新研究院人工智能与机器人创新中心有限公司 , 中国科学院自动化研究所

Inventor： 张兆翔 , 雷震 , 张栩禄 , 吴锦林 , 王玉玺

IPC: G06T11/60 , G06T5/70

Abstract: 本发明提供一种文本生成图像的方法及装置，该方法包括：确定输入的第一文本描述中的各概念在文本生成图像模型生成的图像中对应的预测位置框，所述文本生成图像模型根据第二噪声图像、第二文本描述和输入的参考图像，基于文本反转方法训练得到，所述第一文本描述和所述第二文本描述中包括目标概念，所述参考图像包括所述目标概念的对象；将第一噪声图像和第一文本描述输入文本生成图像模型，根据文本生成图像模型对第一噪声图像每次去噪后的图像确定各概念的注意力图，根据各概念的注意力图在各概念对应的预测位置框上的聚集损失对去噪后的图像进行再次去噪，直到满足预设条件。本发明实现生成图像中不丢失其他概念的对象。

8.

发明授权
基于元学习的域自适应的人脸识别方法、系统、装置有权

公开(公告)号：CN112541458B

公开(公告)日：2023-08-11

申请号：CN202011517834.1

申请日：2020-12-21

Applicant: 中国科学院自动化研究所

Inventor： 朱翔昱 , 雷震 , 郭建珠

IPC: G06V40/16 , G06V10/762 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0985 , G06N3/084 , G06N3/045 , G06N3/0464

Abstract: 本发明属于人脸识别技术领域，具体涉及一种基于元学习的域自适应的人脸识别方法、系统、装置，旨在现有的人脸识别方法依赖于目标场景的样本规模以及识别性能差的问题。本方法包括获取待识别的人脸图像，作为输入图像；通过预训练的人脸识别模型获取所述输入图像的识别结果；其中，所述人脸识别模型基于残差神经网络构建。本发明降低了对目标场景的样本规模的依赖，并提高了人脸识别性能。

9.

发明公开
一种人脸图像识别方法、系统、电子设备及存储介质审中-实审

公开(公告)号：CN116311429A

公开(公告)日：2023-06-23

申请号：CN202310148954.6

申请日：2023-02-14

Applicant: 中国科学院自动化研究所

Inventor： 朱翔昱 , 雷震 , 于畅

IPC: G06V40/16 , G06V10/42 , G06V10/54 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种人脸图像识别方法、系统、电子设备及存储介质，方法包括：将预设的待识别人脸图像输入预设的逆图形胶囊网络，进行图像编码，获取全局形状特征与全局纹理特征；基于预设的图像分解规则，对全局形状特征与全局纹理特征分别进行特征分解，获取部件级别的胶囊特征；对胶囊特征进行图形解码，获取至少一个部件胶囊；基于描述参数中的深度信息，对每个部件胶囊分别进行信息融合，获取至少一个目标胶囊；根据预先获取的待识别人脸图像中各人脸部件的光照值，对目标胶囊进行渲染，获取最终人脸图像，最终人脸图像包括人脸的三维描述信息。有效提升逆图形胶囊网络的可解释性和应用范围，能够较好地识别或处理较大姿态人脸。

10.

发明授权
基于单张源域样本的新场景人脸识别模型构建方法、系统有权

公开(公告)号：CN112329617B

公开(公告)日：2022-10-21

申请号：CN202011216042.0

申请日：2020-11-04

Applicant: 中国科学院自动化研究所

Inventor： 雷震 , 朱翔昱 , 刘浩

IPC: G06V40/16 , G06V10/774 , G06N3/04 , G06N3/08

Abstract: 本发明提供了一种基于单张源域样本的新场景人脸识别模型构建方法、系统。本发明方法包括：基于源域图像样本构成的第一样本集训练人脸识别模型得到第一模型；基于第一模型对第一样本集进行样本特征提取，对各类样本分别基于距离其类别中心的预设距离选取一个源域图像样本作为保留样本加入目标域样本集，得到第二样本集；基于第一模型对第二样本集中各样本进行特征提取，分别计算第二样本集中各类样本的类别特征模板，并扩展到第一模型的分类层中，得到第二模型；基于第二样本集，通过硬标签和软标签的共同约束训练第二模型，得到新场景人脸识别模型。本发明解决了人脸识别方法在应对新场景数据时存在的灾难性遗忘性问题，并减少了训练时间。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification