-
公开(公告)号:CN113269859B
公开(公告)日:2023-11-24
申请号:CN202110642486.9
申请日:2021-06-09
Applicant: 中国科学院自动化研究所
IPC: G06T15/04 , G06T7/10 , G06T7/13 , G06N3/0464
Abstract: 本发明属于视觉信息实时重建领域,具体涉及了一种面向执行器操作空间的RGBD视觉实时重建方法及系统,旨在解决现有技术实时性低、对人工辅助标定依赖性大、对环境变化适应性低的问题。本发明包括:对执行器操作空间环境下获得的RGB图像物体轮廓进行分割;采用基于深度神经网络的投影方法,将在RGB和深度图像中的物体轮廓映射到执行器操作空间,采用距离限制的离群点消除策略减少重建误差;对RGB轮廓进行Delaunay三角形剖分,并根据RGB图像到执行器操作空间的映射关系按照三角形纹理贴图的方式将剖分后的图像的纹理贴到三维物体轮廓上,完成物体信息的重建。本发明不需要计算摄像机内外参,并且重建速度快、实时性强,无需人工辅助标定,对环境变化适应性强。
-
公开(公告)号:CN112561824B
公开(公告)日:2023-04-07
申请号:CN202011519696.0
申请日:2020-12-21
Applicant: 中国科学院自动化研究所 , 桂林电子科技大学
Abstract: 本发明涉及一种2D激光与深度图像融合的数据对齐修复方法及系统,所述数据对齐修复方法包括:提取在相同时刻对相同目标采集的2D激光数据和深度图像数据;确定在2D激光数据与深度图像数据中相似度值最高的序列数据;根据相似度值最高的序列数据,确定所述序列数据中的空洞区域和/或毛刺区域,并基于所述序列数据修复空洞区域和/或毛刺区域。本发明基于时间戳提取相同时刻2D激光数据和深度图像数据,筛选出相似度值最高的序列数据,利用序列数据的相关性将有效序列的变化趋势移植到另一模态的无效数据区间,得到新的修复序列,修复的序列能够增强2D激光地图和深度图像的可视化效果,使两种传感器数据得以互相弥补。
-
公开(公告)号:CN115082775B
公开(公告)日:2022-12-02
申请号:CN202210888803.X
申请日:2022-07-27
Applicant: 中国科学院自动化研究所
IPC: G06V20/00 , G06V10/774 , G06T11/40 , G06T3/40
Abstract: 本发明属于目标检测领域,具体涉及一种基于图像分块的超分辨率增强小目标检测方法、系统、设备,旨在解决解决现有的小目标检测方法检测准确率较低的问题。本方法包括:获取待进行小目标检测的场景图像,作为输入图像;计算输入图像分块时标准块的宽高;得到输入图像在水平方向、垂直方向上分块的步长;对输入图像进行填充,并对填充后的输入图像进行分块,得到输入图像分块后各图像块;采用预训练的超分别率模型对得到的各图像块进行图像增强,增强后,输入训练好的目标检测模型,得到输入图像中各图像块中小目标物体对应的矩形区域,并进行回归、非极大值抑制处理,进而得到检测结果。本发明提高了小目标检测的准确率。
-
公开(公告)号:CN115294659A
公开(公告)日:2022-11-04
申请号:CN202211024304.2
申请日:2022-08-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于时序空间特征的实时桌面手势理解方法、系统、设备,旨在解决解决现有的桌面手势理解方法识别手势精度较差的问题。本方法包括:实时获取待分类识别的桌面手势RGB图像,作为输入图像;将输入图像从RGB空间转换到HSV空间,根据像素点的深度值对输入图像中的手势区域进行分割,分割后进行二值化处理,得到手势二值图像;融合连续n帧输入图像中的手势二值图像,并采用指数衰减模型模拟连续帧手势的衰减过程,构造包含时空特征的时序特征图像;将包含时空特征的时序特征图像输入预构建的手势分类模型,得到输入图像对应的手势类别识别结果。本发明提升了手势识别精度。
-
公开(公告)号:CN115082299A
公开(公告)日:2022-09-20
申请号:CN202210857769.X
申请日:2022-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像转换技术领域,具体涉及了一种非严格对齐的小样本不同源图像转换方法、系统及设备,旨在解决现有深度学习的模型训练样本图像少、获取困难,导致训练好的模型性能较低的问题。本发明包括:构建图像转换模型,其生成器基于编码器、转换器和解码器构建,判别器基于卷积神经网络和激活函数构建;获取X类别和Y类别图像对,并进行图像增强;通过增强后的图像对进行图像转换模型的训练;通过训练好的图像转换模型,将获取的一个或少量X类别图像转换为Y类别图像。本发明通过非严格对齐方法构建容易获得的图像类别向不容易获得的图像的转换,有效提升不容易获得的图像的目标特征学习效果。
-
公开(公告)号:CN112561824A
公开(公告)日:2021-03-26
申请号:CN202011519696.0
申请日:2020-12-21
Applicant: 中国科学院自动化研究所 , 桂林电子科技大学
Abstract: 本发明涉及一种2D激光与深度图像融合的数据对齐修复方法及系统,所述数据对齐修复方法包括:提取在相同时刻对相同目标采集的2D激光数据和深度图像数据;确定在2D激光数据与深度图像数据中相似度值最高的序列数据;根据相似度值最高的序列数据,确定所述序列数据中的空洞区域和/或毛刺区域,并基于所述序列数据修复空洞区域和/或毛刺区域。本发明基于时间戳提取相同时刻2D激光数据和深度图像数据,筛选出相似度值最高的序列数据,利用序列数据的相关性将有效序列的变化趋势移植到另一模态的无效数据区间,得到新的修复序列,修复的序列能够增强2D激光地图和深度图像的可视化效果,使两种传感器数据得以互相弥补。
-
公开(公告)号:CN106095950A
公开(公告)日:2016-11-09
申请号:CN201610422829.X
申请日:2016-06-14
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种人机对话中教授意图答案生成方法,所述方法包括:对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图则进入下一步骤;在所述历史记录中寻找当前对话对应的问句;结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;对于相关答案集合进行过滤;基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果及当前对话的回答返回。本发明能够对人机对话中教授意图下对用户的教授内容进行良好的反馈,提高人机对话的满意度。
-
公开(公告)号:CN102831606B
公开(公告)日:2014-10-22
申请号:CN201210272187.1
申请日:2012-08-01
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明提供了一种在医学影像中获取发音器官轮廓的方法。该方法包括:对于医学图像,利用唇部与背景的自动分割阈值,对医学影像中嘴唇与背景区域进行二值化,得到唇部轮廓;在唇部轮廓包含的面部范围内,提取上牙齿轮廓、下牙齿轮廓、上颌轮廓和下颌轮廓;针对上颌轮廓和下颌轮廓之间图像区域,获取舌位轮廓的可靠边缘点;以及由舌位轮廓的可靠边缘点拟合出舌位边缘轮廓。本发明能自动从影像背景中分割出发音人头部、器官区域,整个过程自动完成,无需人工交互。
-
公开(公告)号:CN103700130A
公开(公告)日:2014-04-02
申请号:CN201310746136.2
申请日:2013-12-30
Applicant: 中国科学院自动化研究所
IPC: G06T13/80
Abstract: 本发明提供了一种发音器官动画生成方法,包括:发音器官运动关键点的定义,各发音器官的中矢状面的二维网格的生成,发音器官纹理贴图,基于薄板样条的网格运动计算。本发明由发音器官运动关键点的位置,推算出发音器官中矢状面的形状,进而可以由发音器官运动关键点的运动,直接得到整个发音器官在中矢状面的运动情况,其优势在于简化的发音器官运动的描述参数,降低了发音器官动画制作的难度。
-
公开(公告)号:CN102820030A
公开(公告)日:2012-12-12
申请号:CN201210265448.7
申请日:2012-07-27
Applicant: 中国科学院自动化研究所
IPC: G10L13/00
Abstract: 本发明提供了一种发音器官可视语音合成系统,包括:音频分析模块、参数映射模块、动画驱动模块和运动分析模块,其中:音频分析模块,用于接收输入的说话人语音信号,根据能量信息判断静音段,将非静音段语音进行编码,输出语音线谱对参数;参数映射模块,用于接收音频分析模块实时传递来的语音线谱对参数,并利用经过训练的混合高斯模型,将其转化为模型运动参数;动画驱动模块,用于接收参数映射模块实时生成的模型运动参数,驱动虚拟发音器官模型的关键点运动,进而带动整个虚拟发音器官模型的运动。本发明直接由输入语音的频域参数生成相应的运动参数来带动模型运动,具有不受在线数据库的限制和生理模型的限制优点。
-
-
-
-
-
-
-
-
-