-
公开(公告)号:CN111582220A
公开(公告)日:2020-08-25
申请号:CN202010419839.4
申请日:2020-05-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于移位图卷积神经网络骨骼点行为识别系统包括:图像获取模块、图像处理模块、提取模块和行为识别模块,其中图像获取模块用于获取行为图像;图像处理模块用于处理图像获取模块获取的行为图像进行图像处理;提取模块用于提取图像处理模块处理后图像的骨骼点;行为识别模块用于识别提取模块提取骨骼点行为特征的。本发明设计行为识别模块进行对骨骼点行为识别,减小图卷积计算量的新型图卷积,与传统图卷积不同,移位图卷积不是通过扩大卷积核来扩展感受范围,而是通过新型移位操作来使得图特征进行移位拼接,在显著减少计算量提高计算速度的情况下达到同样甚至更高的识别精度,避免传统图卷积的计算量会随着卷积核增大而增大。
-
公开(公告)号:CN110197254A
公开(公告)日:2019-09-03
申请号:CN201910340616.6
申请日:2019-04-25
Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院 , 河南理工大学
Abstract: 本发明涉及一种基于深度迁移学习的线特征描述方法,包括:采集图像并进行预处理、利用已有技术提取图像中的直线、获取正确匹配直线对、确定直线对应的图像块;构建用于线特征描述的卷积神经网络;利用点特征描述网络的参数初始化线特征描述网络的参数;利用线匹配数据集对网络参数进行调整;利用步骤S4获取的网络参数更新CL2-Net的参数值;重复参数更新步骤,直到参数更新达到指定的次数;获取输入直线的描述子。本发明提供的方法可获得具有较好辨别能力和鲁棒性的描述子。
-
公开(公告)号:CN109788191A
公开(公告)日:2019-05-21
申请号:CN201811573231.6
申请日:2018-12-21
Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院
IPC: H04N5/232
Abstract: 本申请涉及一种拍照方法、装置、计算机设备和存储介质,所述方法通过获取拍摄设备的预设拍摄策略和预拍摄图像,将预拍摄图像输入关键点检测模型,通过关键点检测模型对预拍摄图像进行检测,得到各个拍摄对象的位姿和对应的关键点的位置,当全部关键点的位置位于预设区域时,判断拍摄对象的位姿与预设拍摄策略对应的标准位姿是否匹配,当拍摄对象的位姿与预设拍摄策略对应的位姿匹配时,生成拍照指令,执行拍照指令,得到对应的拍照图像。通过关键点检测模型对拍摄对象的关键点进行检测,根据关键点所处的位置和拍摄对象的位置确定是否拍摄,当都满足时拍照,使得拍摄更为便捷,得到的图像更为精美。
-
公开(公告)号:CN109613930A
公开(公告)日:2019-04-12
申请号:CN201811574717.1
申请日:2018-12-21
Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院
IPC: G05D1/10
Abstract: 本申请涉及一种无人飞行器的控制方法、装置、无人飞行器及存储介质。其中,无人飞行器的控制方法包括:获取拍摄图像;识别拍摄图像,获取拍摄图像的跟踪目标,以及获取拍摄图像的跟踪目标的手势信息;根据手势信息控制无人飞行器飞行。利用无人飞行器获取的拍摄图像做目标检测,得到跟踪目标,即特定指挥者,进一步地获取跟踪目标的手势信息,进而根据手势信息对应的控制指令来控制无人飞行器,实现基于视觉识别的无人飞行器手势控制,提供了无约束的人机交互方式,进一步实现无人飞行器的自动化。
-
公开(公告)号:CN119721249A
公开(公告)日:2025-03-28
申请号:CN202411817102.2
申请日:2024-12-11
Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所
IPC: G06N5/04 , G06N3/092 , G06N3/0495 , G06N3/0455
Abstract: 本发明公开了一种基于大语言模型的整数规划自动建模方法,包括获取整数规划问题数据集,采用数据增强和动态复杂度平衡方法进行处理,得到多模态表示的平衡数据集;采用模型架构搜索和组合优化方法进行处理,得到优化后的神经网络模型结构;采用动态稀疏化训练和自适应难度课程学习方法进行处理,得到经过第一阶段训练的模型;采用层次化强化学习和多目标帕累托前沿探索方法进行处理,得到经过第二阶段训练的最终模型;采用动态神经符号推理方法进行处理,得到逻辑一致性增强的整数规划模型;采用自适应对抗性测试生成方法进行处理,得到全面评估结果。本发明提升了整数规划问题的建模效率、准确性和适应性。
-
公开(公告)号:CN119293139B
公开(公告)日:2025-03-14
申请号:CN202411806624.2
申请日:2024-12-10
Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/334 , G06F16/35 , G06F18/10 , G06F18/213 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种用于增强大语言模型多模态长上下文对话能力的记忆检索方法,包括对原始多模态对话序列进行基于信息密度的自适应切分并提取局部特征;构建三层特征金字塔结构实现多尺度特征表示;通过特征压缩和时序依赖图建模增强特征的时序表达能力;基于特征稳定性评估构建记忆向量序列;对查询数据进行结构化表示并与记忆向量进行多层次交互;通过层次化索引和多维度相似度计算实现高效检索;基于用户反馈定期优化记忆序列。本发明能够有效提升模型在长对话场景下的多模态信息理解和检索能力,具有重要的实践应用价值。
-
公开(公告)号:CN119294403B
公开(公告)日:2025-02-25
申请号:CN202411807081.6
申请日:2024-12-10
Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所
IPC: G06F40/30 , G06F16/36 , G06N5/04 , G06F16/334 , G06F16/35 , G06F18/214 , G06F18/23 , G06F18/213 , G06N3/044
Abstract: 本发明公开了一种面向组合优化自动建模的训练数据生成方法及系统,该方法包括接收问题描述文本,通过语义分析和知识推理提取关键信息,构建结构化的优化问题表示;读取结构化表示,从二值标签矩阵提取目标函数组件,从约束关系邻接矩阵提取约束函数组件,从变量依赖矩阵提取变量定义组件,将组件整合形成模型组件集合;为变量生成取值区间参数,为约束矩阵生成系数参数,为目标函数生成权重参数,得到参数化模型实例;对场景元素、变量和约束描述应用相应模板生成问题描述文本。本发明通过系统化的信息提取和参数生成方法,实现了高质量训练数据的自动化生成,提高了数据的多样性和实用性。
-
公开(公告)号:CN111460978B
公开(公告)日:2023-06-23
申请号:CN202010237340.1
申请日:2020-03-30
Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所
IPC: G06V20/52 , G06V40/20 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提出了一种基于动作判定传感器和深度学习技术的幼儿行为监控系统及其判定方法,监控系统包含图像处理和步态识别两种模式,上述两种模式相互融合提高幼儿行为的判定准确度。图像处理基于深度学习技术,通过对分类好的幼儿图片使用CNN进行训练,得到相应的分类模型,在空间上监测点在t时刻的幼儿动作变化数据,从而更好地预测下一帧的动作,相比于传统的单帧识别判断,本发明具有良好地预判性。为应对图像处理时可能造成的误判,本发明将步态识别融入其中,感知幼儿的行为实际动作,在幼儿行为图片学习的基础之上结合幼儿行为产生的加速度变化差和压感变化差进行反馈学习。上述两种方式相结合有效提高了幼儿行为监控的准确度和预判能力。
-
公开(公告)号:CN111091577B
公开(公告)日:2023-06-23
申请号:CN201911241559.2
申请日:2019-12-06
Applicant: 中科南京人工智能创新研究院 , 河南理工大学 , 中国科学院自动化研究所
IPC: G06T7/13 , G06V10/44 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及一种基于伪孪生网络的线特征描述方法,包括:步骤S11:获取同一场景不同变换的图像对;步骤S12:检测图像中的直线;步骤S13:获取正确匹配直线对;步骤S14:确定直线对应的图像块;步骤S2:搭建用于线特征描述的全卷积伪孪生网络;步骤S31:获取训练子集;步骤S32:计算网络输出特征向量;步骤S33:对网络参数进行调整;步骤S4:更新网络参数值;步骤S5:参数迭代更新至指定的次数;步骤S6:获取输入直线的描述子。本发明提供的方法可获得具有强区分性的描述子。
-
公开(公告)号:CN109543534A
公开(公告)日:2019-03-29
申请号:CN201811231109.0
申请日:2018-10-22
Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院
Abstract: 本发明实施例提出的一种目标跟踪中目标丢失重检的方法及装置,通过对当前帧图像进行像素点的随机采样,从而确定相似搜索框,缩小搜索范围,再对相似搜索框进行计算范围扩大,得到目标搜索区域,根据目标搜索区域中各像素点的搜索框的位置精确确定目标的位置。本申请提供的技术方案,通过缩小搜索范围,降低目标重检的时间复杂度,高效地处理目标跟踪过程中目标丢失的问题,从而使跟踪器对运动物体的鲁棒性更好。
-
-
-
-
-
-
-
-
-