一种基于半监督学习的医学图像分割方法

    公开(公告)号:CN115511795A

    公开(公告)日:2022-12-23

    申请号:CN202211088281.1

    申请日:2022-09-07

    Abstract: 本发明公开了一种半监督学习医学图像分割方法:步骤一:预训练;首先针对第一原始医学图像对精修复网络进行预训练;得到训练好的精修复网络;步骤二(微调):将训练好的精修复网络中编码器与随机初始化的解码器结合得到分割网络;对第二原始医学图像集经过人工标注得到分割数据集;利用分割数据集对分割网络进行训练,得到训练好的分割网络;步骤三:利用训练好的分割网络作为教师模型进行自训练得到训练好的学生模型;步骤四:将待分割图像输入训练好的学生模型得到分割结果。本发明的方法利用容易获取的、大量的原始数据,解决了用于训练深度学习分割模型的标注数据不足导致分割准确性低的技术问题。

    一种基于布局约束的视频文字追踪方法

    公开(公告)号:CN109800757B

    公开(公告)日:2022-04-19

    申请号:CN201910006843.5

    申请日:2019-01-04

    Abstract: 为了解决大幅度相机移动下的多文字追踪,本发明提出了一种基于布局约束的视频文字追踪方法。该方法的输入为视频和视频帧的文字检测结果,输出为文字追踪后的轨迹信息。首先,通过初始视频帧的检测结果进行文字轨迹的初始化,然后将上一帧的文字轨迹与当前帧的检测结果送入本发明的追踪方法中进行文字轨迹的更新。文字轨迹更新的核心是将当前帧检测到的文字区域对应到已有的文字轨迹,该过程可以视为一种数据匹配问题。本发明针对此问题设计一个新的数据匹配代价函数,通过求解代价函数的得到最佳匹配结果。经过重复轨迹更新过程直到视频处理结束,最终得到文字追踪结果。本发明在数据匹配代价函数中引入布局约束,通过文字区域间的整体外观结构进行文字追踪,可以有效避免因为相机大幅度运动导致错误追踪结果,具有更好的追踪效果。

    一种基于正交损失函数的多任务分类网络的构建方法

    公开(公告)号:CN110929624A

    公开(公告)日:2020-03-27

    申请号:CN201911124037.4

    申请日:2019-11-18

    Abstract: 本发明提供了一种基于正交损失函数的多任务分类网络的构建方法,构建的多任务分类网络模拟了人类学习过程,用深度卷积神经网络作为隐藏层模拟人的大脑进行深度特征提取,使用树分类器作为任务相关的输出层进行递进式分类,将识别过程构成不同的学习任务。本发明使不同任务得到的特征更加符合各自的需求,使分类器在完成粗分类任务时使同一粗类的深度特征更加聚合,而在完成细分类任务时,不同细类的深度特征更加离散,对不同分类任务的任务输出层特征进行区分,使得不同层级的分类器得到更加匹配不同分类任务的特征,去掉无用特征,从而提高分类准确率。

    基于特有信息同步分解的红外与可见光图像融合方法

    公开(公告)号:CN109447933B

    公开(公告)日:2019-10-22

    申请号:CN201811351004.9

    申请日:2018-11-14

    Abstract: 本发明提出基于特有信息同步分解的红外与可见光图像融合方法,包括以下步骤:图像预处理、图像均值剥离、字典学习和构建、图像的联合稀疏分解、稀疏系数融合、均值融合和图像重构;本发明通过在联合稀疏表示模型下提出了一种对红外与可见光图像的特有信息进行同步正交匹配追踪分解的图像融合算法,可以将对原始根据图像块的融合方式进一步细化到对参与这个图像块的所有原子表示系数进行融合,提高了融合的全面性与完整性,得到的融合图像特征明显,信息全面,即它不仅能将红外与可见光图像的特有信息融合到一起,而且融合图像整体更加清晰,并不会出现某一块区域失真现象。

    小波变换与联合稀疏表示的红外与可见光图像融合方法

    公开(公告)号:CN107341786B

    公开(公告)日:2019-09-24

    申请号:CN201710466497.X

    申请日:2017-06-20

    Abstract: 本发明提供了一种小波变换与联合稀疏表示的红外与可见光图像融合方法,涉及图像融合领域,首先对源图像进行DWT变换,分解成低频子带与高频子带系数,并用滑窗策略将低频子带系数分解成矩阵,再针对上述分解的低频子带矩阵学习字典,其次,分别融合低频子带系数和高频子带系数,最后通过DWT逆变换重构出融合图像,本发明既能有效地稀疏表示源图像的显著细节特征,又能多尺度地融合图像细节信息,即很好地保留了红外图像的目标信息与可见光图像的细节、轮廓等背景信息,提高了目标的识别能力,有利于后续处理系统对信息的提取与使用,较传统的小波变换融合方法以及现有的基于联合稀疏表示的融合方法均具有优势。

    一种基于Kinect的虚拟钢琴弹奏系统的构建方法

    公开(公告)号:CN109448131A

    公开(公告)日:2019-03-08

    申请号:CN201811243690.8

    申请日:2018-10-24

    Abstract: 本发明提供了一种基于Kinect的虚拟钢琴弹奏系统的构建方法,利用Kinect设备完成场景的三维重建,在场景中在合适的平面上选择创建虚拟键盘的区域,产生虚拟琴键,进行琴键按压检测后,设置对应音符播放,即可实现弹奏虚拟钢琴的功能。本发明作为人和机器的交互方式,简单便捷的虚拟键盘,可以扩展到智能家居、游戏及机器人等领域;采用OpenGL库用作显示,并且结合了指尖位置的值来判断琴键的状态,提高了琴键弹奏的准确度,能够带来良好的用户体验。实现虚拟钢琴时,建立了三维立体模型,使得画面效果更有立体感,满足人们的沉浸式的体验。

    基于语义层级的多任务Triplet损失函数学习方法

    公开(公告)号:CN110909785A

    公开(公告)日:2020-03-24

    申请号:CN201911124067.5

    申请日:2019-11-18

    Abstract: 本发明提供了一种基于语义层级的多任务Triplet损失函数学习方法,为数据库构建语义层级网络,语义层级进行triplets采样,对多任务Triplet网络训练,利用树分类器进行多任务分类。本发明针对Triplet网络多层次化训练的问题,提出了一种将语义层级网络与Triplet相结合的损失函数,利用语义知识指导网络层次化的区分样本结构,学习到一种包含语义层级信息且泛化性更强Triplet特征,有效的运用在多任务学习中,提升了不同语义层次下的特征可分性。同时,研究了一种新的层级化采样方法,使得网络能够挖掘到更有效的hard triplets,最终提升网络的性能。

Patent Agency Ranking