-
公开(公告)号:CN1785609A
公开(公告)日:2006-06-14
申请号:CN200510111830.2
申请日:2005-12-22
Applicant: 复旦大学
Abstract: 本发明属于智能机器人技术领域,具体为一种新型的机械手结构,能够模拟人手抓持物体的功能。本发明采用2套微型伺服电机和驱动器作为驱动单元,采用一个控制器来同时控制2套伺服电机,大拇指和四个手指分别单独控制和运动,四个手指能够在不同的初始位置进行联动。大拇指和四个手指的传动机构均采用两级传动,初级传动采用具有自锁功能的蜗轮蜗杆传动副,具有稳定的瞬时传动比和较高的传动精度,第二级传动采用圆形同步带传动。系统采用PID反馈控制,能够精确控制伺服电机的速度和位置。本发明其小巧而紧凑的机械结构相对于传统的机器人结构更加灵活、便利。本发明着重人性化设计和智能化设计,具有明显的社会效益和客观的经济效益。
-
公开(公告)号:CN118010026A
公开(公告)日:2024-05-10
申请号:CN202410148260.7
申请日:2024-02-02
Applicant: 复旦大学
IPC: G01C21/20 , G06F18/25 , G06F18/24 , G06N3/0442 , G06N3/0455 , G06N3/092 , G06N3/0464 , G06F16/29 , G06F17/18 , G01C21/00
Abstract: 本发明属于视觉语言导航技术领域,具体为一种基于历史上下文信息增强的视觉语言导航方法。本发明包括显式建模语言指令和视觉观测之间的历史交互,捕获导航过程中长期的时间上下文;使用状态向量检索全局内存库,自适应选择历史导航中最重要的情景,并将历史导航情景压缩为全局记忆向量;引入长短时记忆网络,自适应地学习多模态融合网络输出的状态信息、全局记忆信息、和前序状态信息之间的关系,更新最终的状态向量。本发明可提高动作预测准确性,使得机器人具有更强大的时序记忆理解能力,更好地完成视觉语言导航任务。本发明解决了以前方法仅依赖前一个时间步的状态表示,不足以捕获长期时间上下文,从而遗漏有用历史导航信息的问题。
-
公开(公告)号:CN115205987A
公开(公告)日:2022-10-18
申请号:CN202110393854.0
申请日:2021-04-13
Applicant: 复旦大学 , 中国科学院长春光学精密机械与物理研究所
IPC: G06V40/70 , G06V10/26 , G06V10/40 , G06V10/774 , G06V10/80
Abstract: 本发明提供了一种双重注意力机制的舌裂纹提取方法,用于对舌裂纹图像进行提取得到舌裂纹结果,其特征在于,包括如下步骤:调整舌裂纹图像的亮度以及对比度得到变换后图像;对舌裂纹图像以及变换后图像处理得到双重输入特征图;通过编码器从双重输入特征图中提取得到深层次特征图,解码器对深层次特征图还原得到高级别特征图;对舌裂纹图像进行卷积处理得到低级别特征图,利用双重注意力机制模块对高级别特征图以及低级别特征图进行信息融合得到像素级别的标签,从标签中得到舌裂纹结果。其中,双重输入特征图、深层次特征图以及高级别特征图均通过快速卷积模块进行快速特征提取得到。
-
公开(公告)号:CN114969459A
公开(公告)日:2022-08-30
申请号:CN202210343042.X
申请日:2022-04-02
Applicant: 复旦大学
IPC: G06F16/9032 , G06F16/33 , G06N5/04 , G06N5/02
Abstract: 本发明涉及是计算机多模态信息处理领域和认知科学领域,主要涉及一种基于认知双通道的认知推理的视觉问答方法。主要包括以下步骤:步骤1,构建认知内容,提取问题关键字,图像目标区域的标签内容,作为检索大型知识库的索引,通过检索内容构建任务知识库;步骤2,先验认知计算,通过多模态预训练模型,训练视觉文本内容表征;步骤3,构建任务的推理时空特性,通过对问句进行句法分析、词性分析,构建了问题关键字词之间的拓扑图,运用步骤2中的视觉表征内容计算图像内部区域的关联度,构建图像内容空间图结构;步骤4,锁定与问答内容相关的图像内容,根据步骤2中的联合表征的视觉向量、文本向量,计算每个文本向量关注的图像内容,构建问答关联图像内容;步骤5,层次认知的推理,联合步骤1中构建的知识内容与步骤2的先验计算,对问答内容重新编码,根据重编码的表示内容与步骤3分析的时空特性相结合,构建问答指令集合,通过问答指令进行问答推理,获取视觉问答的结果。本发明提高了开放域视觉问答模型的准确率,在推理过程中根据外部知识内容不断修正对问答内容的认知理解,使得视觉问答过程具有鲁棒性和可解释性。
-
公开(公告)号:CN114862747A
公开(公告)日:2022-08-05
申请号:CN202110156609.8
申请日:2021-02-04
Applicant: 复旦大学
Abstract: 本发明提供了一种基于信息补全的全卷积细化网络腺体图像分割方法,用于对腺体图像进行分割处理得到腺体分割结果,其特征在于,其特征在于,包括如下步骤:先通过空间信息补充模块依次对相邻的两个特征进行空间信息补充处理得到多个第一信息补全特征;然后,语义信息引导模块依次对相邻的两个特征进行语义信息补充处理得到多个第二信息补全特征;接着,将第一信息补全特征以及第二信息补全特征输入解码器得到初始分割结果。通过本发明的一种基于信息补全的全卷积细化网络腺体图像分割方法,可以补全图像因为需要下采样至低分辨率而损失的信息,从而提高分割边界的准确性,并得到准确的高分辨率分割结果。
-
公开(公告)号:CN114757192A
公开(公告)日:2022-07-15
申请号:CN202210341776.4
申请日:2022-04-02
Applicant: 复旦大学
IPC: G06F40/295 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明属于计算机自然语言处理技术领域,具体为一种融合注意力机制和片段排列的实体关系联合抽取方法。该方法的步骤包括:输入文本,将输入的文本转化为词向量;基于片段排列的方式枚举所有可能的候选片段;将所有的候选片段输入到注意力机制的神经网络模型,根据注意力得分进行剪枝,来减少实体负样本的数量;进行命名实体识别和关系抽取。本发明基于片段排列的方式,能够枚举所有可能的片段,选择的每一个片段都是独立的,可以直接提取片段级别的特征去解决重叠实体问题。同时,针对实体负样本数量过多的问题,本发明加入了注意力机制,根据注意力的得分,可以有效地删除部分负样本以提高实体关系联合抽取的性能。
-
公开(公告)号:CN114529795A
公开(公告)日:2022-05-24
申请号:CN202011218825.2
申请日:2020-11-04
Applicant: 复旦大学
Abstract: 根据本实施例提供的一种基于优化热度图监督机制的服饰关键点检测方法,将服饰关键点检测训练集通过多重分辨率热度图计算得到三种尺度的预测热度图,由于所采用的骨干网络为HRNet因此能够在信息传输过程中保持高分辨率,然后通过在逐渐聚焦热图监督机制中添加标准偏差逐渐降低的高斯核的方法能够在增大空间分辨率的同时带来冗余的空间信息,最后通过计算水平损失函数、均方误差,并通过所述以反向传播的方式对服饰关键点检测网络进行训练从而得到服饰关键点检测网络。通过水平损失函数对服饰关键点检测网络进行训练能够在不过多损害计算性能的前提下,训练出了更佳的检测模型,提升了服饰关键点检测的精度。
-
公开(公告)号:CN114092854A
公开(公告)日:2022-02-25
申请号:CN202111295019.X
申请日:2021-11-03
Applicant: 复旦大学
Abstract: 本发明公开了一种基于深度学习的脊柱退行性病变智能康复辅助训练系统。本发明系统包括基于深度学习的中医导引术视频实时分类模块和基于人体骨架表示的视频序列划分与评估模块;前者通过获取二维人体骨架数据,作为学习模型的训练数据,进行深度学习训练,得到泛化的深度学习模型;最后得到实时帧分类结果;后者根据帧分类结果,对相同类别的骨架序列进行分割与实时纠错,将分割好的序列段与相应类别专家组视频骨架序列段进行序列对比评分。本发明系统无需医护人员的指导和干预,能够使患者随时自行进行中医导引术训练,适用于家庭及基层医疗卫生机构,能够减轻医护人员的压力,提高患者康复训练的灵活性和准确性。
-
公开(公告)号:CN113592880A
公开(公告)日:2021-11-02
申请号:CN202110870992.3
申请日:2021-07-30
Applicant: 复旦大学
Abstract: 本发明提供了一种基于高斯混合模型的唇部分割方法,包括以下步骤:步骤1,对输入图像进行人脸检测,获取人脸上半部分区域,将该区域的像素颜色作为训练数据建立肤色高斯混合模型并计算下半脸中每个像素的肤色概率值,得到人脸下部肤色概率图;步骤2,根据嘴唇的先验知识,在人脸下部肤色概率图中迭代检测得到唇部区域;步骤3,将唇部区域和非唇部区域的像素作为训练数据建立唇部区域和非唇部区域的高斯混合模型并计算唇部区域中各像素的概率值,得到背景概率图;步骤4,对背景概率图进行OSTU二值化处理并通过区域生长法和中值滤波进行优化,最后通过k‑points方法处理得到最佳唇部区域;步骤5,根据最佳唇部区域在输入图像中对应提取嘴唇轮廓图像。
-
公开(公告)号:CN111275172A
公开(公告)日:2020-06-12
申请号:CN202010068826.7
申请日:2020-01-21
Applicant: 复旦大学
Inventor: 张文强
Abstract: 本发明涉及一种基于搜索空间优化的前馈神经网络结构搜索方法,包括以下步骤:S1:按照搜索空间的定义随机生成设定数量的搜索空间并转化为离散编码,构建搜索空间初始种群;S2:利用超网络对初始种群中的所有搜索空间进行性能评估;S3:根据性能评估结果对搜索空间进行优化,输出最优搜索空间;S4:对应搜索算法在最优搜索空间中,搜索设定模型评估算法下最优的前馈神经网络结构,并利用该神经网络结构完成需求数据集下的需求任务,与现有技术相比,本发明具有提高神经网络结构搜索的效率和性能等优点。
-
-
-
-
-
-
-
-
-