-
公开(公告)号:CN117746449A
公开(公告)日:2024-03-22
申请号:CN202211103799.8
申请日:2022-09-09
Applicant: 复旦大学
IPC: G06V30/412 , G06N3/0464 , G06N3/084 , G06N3/088 , G06V10/82 , G06V30/19
Abstract: 本发明提供了一种基于自蒸馏的半监督文本识别方法,包括:步骤S1‑1,将待识别文本图像经过预处理得到预处理文本图像;步骤S1‑2,将预处理文本图像输入预先训练好的文本识别模型进行推理,迭代地得到文本行中每一个位置的行文本识别结果;步骤S1‑3,对行文本识别结果中进行字符拼接得到最终的文本识别结果,其中,文本识别模型的训练过程包括监督学习训练阶段以及基于半监督学习框架进行的半监督学习训练阶段。因此本发明提供的基于自蒸馏的半监督文本识别方法在半监督学习框架的基础上实现了利用无标签数据的半监督学习,并通过基于注意力对齐的自蒸馏算法实现了效果更好、更加稳定的半监督学习。
-
公开(公告)号:CN116415653A
公开(公告)日:2023-07-11
申请号:CN202111627025.0
申请日:2021-12-28
Applicant: 复旦大学 , 上海新氦类脑智能科技有限公司
Abstract: 本发明提供一种基于知识蒸馏的类别增量神经网络模型聚合方法,具体包括以下步骤:步骤S1,获取聚合所需的增量类别信息以及聚合所得模型的具体结构信息;步骤S2,根据增量类别信息以及结构信息选择多个异构模型作为待聚合模型,并构建初始聚合模型;步骤S3,采用无监督数据对待聚合模型以及初始聚合模型进行类别增量模型聚合,并基于聚合时的类别增量蒸馏损失以及特征过滤损失更新初始聚合模型直至生成增量模型;该方法支持异构待聚合模型间的聚合任务,同时只需单轮聚合就能使聚合模型收敛,大大降低模型聚合过程中的通信成本。
-
公开(公告)号:CN116012689A
公开(公告)日:2023-04-25
申请号:CN202111220282.2
申请日:2021-10-20
Applicant: 复旦大学
IPC: G06V10/82 , G06V10/774 , G06V10/80 , G06V10/44 , G06V10/46 , G06T7/00 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06N3/084
Abstract: 本发明提供一种基于拓扑结构约束的半监督医学影像标志点定位方法,其特征在于,包括:步骤S1,对图像进行预处理,得到初始训练集。步骤S2,将初始训练集输入到深度神经网络进行训练,根据有无标注信息,对样本分开进行监督训练和自监督训练。步骤S3,将待测图像输入到训练完成的深度神经网络,预测坐标偏移图和预测热点图。步骤S4,利用投票法对预测热点图所表示标志点在图中出现的概率,对高于设定阈值的像素点进行投票,并根据投票结果标出待测图像上的最终标志点坐标。其中,深度神经网络包括多任务U‑Net网络、多分辨率注意力模块以及多分支空洞卷积模块。
-
公开(公告)号:CN109897822B
公开(公告)日:2023-04-04
申请号:CN201711309755.X
申请日:2017-12-11
Applicant: 复旦大学
IPC: C12N5/0781 , C12N15/11 , C12R1/91
Abstract: 本发明提供了一组人永生化B淋巴细胞系的建立和应用,具体地,本发明将4株具有亲缘关系的永生化淋巴细胞系组合用作对检测平台进行准确性评判的标准物产品,并且将4株具有亲缘关系的永生化淋巴细胞系用作表观基因组、转录组、蛋白质组、代谢物组的标准物产品时,可形成内在的量值差异梯度,用于评价组学检测的灵敏度。
-
公开(公告)号:CN114255376A
公开(公告)日:2022-03-29
申请号:CN202011008930.3
申请日:2020-09-23
Applicant: 复旦大学 , 上海新氦类脑智能科技有限公司
IPC: G06V10/774 , G06V10/764 , G06V20/00 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种基于显著图的多标签图像识别系统,包括裁剪图像的图像预处理模块,由此得到特征图的特征提取模块,根据特征图得到置信度分数以及分类权重的分类模块,通过训练控制模块控制训练模块对置信度分数以及特征图处理得到损失函数对特征提取模块以及分类模块更新,最终识别控制模块将自然场景图像经过图像预处理模块、更新得到的特征提取模块以及分类模块得到置信度分数通过判断出自然场景图像标签。因此本实施例提供的多标签图像识别系统根据多标签分类损失函数以及多标签分布损失函数迭代能够在多标签图像识别过程中减少复杂背景和物体形变的干扰,避免受到遮挡、光照、视点等的干扰并提高多标签图像识别的准确率。
-
公开(公告)号:CN113963389A
公开(公告)日:2022-01-21
申请号:CN202010625509.0
申请日:2020-07-01
Applicant: 复旦大学 , 上海新氦类脑智能科技有限公司
Abstract: 本发明提供一种基于深度神经网络的人脸关键点检测方法具体图像处理技术领域。该方法具体为:使用公开数据集和部分人工标注的人脸图片数据集,数据集中包含人脸图片和对应的人脸关键点的位置信息;搭建沙漏网络作为人脸关键点检测模型并训练收敛,作为后续操作的基础;从概率的角度出发,假设所有关键点都有着良好语义定义的标注标准,即可以得到一个没有标注者误差干扰的理想标注,通过循环迭代搜索的方式得到一个更可能没有标注者误差干扰的值即更具语义信息的值作为新的训练标签来微调网络参数,并引入人脸关键点相关性对搜索过程加入约束。本发明能够应对由标注者引入的标注误差问题,有效提升了人脸关键点检测的准确率和鲁棒性。
-
公开(公告)号:CN112884004A
公开(公告)日:2021-06-01
申请号:CN202110080355.6
申请日:2021-01-21
Applicant: 复旦大学
Abstract: 本发明提供了一种神经网络模型知识重合度的度量方法,针对多个可微的端侧模型进行重合度度量,其特征在于,包括如下步骤:步骤S1针对所有端侧模型生成由伪样本构成的伪样本集;步骤S2将伪样本集输入训练好的编码器得到与端侧模型对应的多个高斯分布,计算高斯分布之间的距离,将计算结果作为知识重合度从而令用户掌握多个端侧模型的重合情况。其中,步骤S2包括将伪样本集输入原始编码器得到初始隐变量以及隐变量正态分布,并输入原始解码器得到解码样本;计算解码样本与伪样本之间的重构误差,并反向传播从而训练更新原始编码器得到编码器;将伪样本集输入编码器得到隐变量以及对应的高斯分布;计算高斯分布之间的距离从而得到知识重合度。
-
公开(公告)号:CN103699907A
公开(公告)日:2014-04-02
申请号:CN201410002727.3
申请日:2014-01-04
Applicant: 复旦大学
IPC: G06K9/62
Abstract: 本发明属于数字图像处理及模式识别技术领域,具体为一种基于机器学习的农药喷洒检测方法。本发明先在农业作业场景的监控视频中,获取大量务农人员背着农药箱和不背农药箱进行走动的视频,采用较适合刚性物体检测的方法检测农药箱;从视频中各抽取部分图片作为样本,对每个抽取的图片中的农药箱图像进行特征提取,将这些特征组合成特征向量;然后对每幅特征向量用Adaboost的方法进行级联训练,形成一个Adaboost级联分类器,然后将大量的包含或不包含农药箱的图像用该分类器检测图像中是否存在农药箱。本发明具有高实时性和高易实施性,解决了需要实体考察才能判断是否有人在喷洒农药以及农药喷洒效果的弊端。
-
公开(公告)号:CN116363670A
公开(公告)日:2023-06-30
申请号:CN202111578044.9
申请日:2021-12-22
Applicant: 复旦大学
IPC: G06V30/244 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于笔画树表示的中文字符识别方法,根据中文字符可以层级拆解的特性,充分考虑中文字符的结构信息并将中文字符表示成为笔画树的形式,因此在现有技术的基础之上进一步缓解了序列表示到中文字符的一对多的问题;还由于本发明的方法在计算距离时为部首结构赋予更高的权重,因此使得候选的预测中文字符整体上更加贴近标签中文字符,从而提高了预测准确度。进一步,由于笔画树的表示方式融合了部首层级和笔画层级的表示优势,使得神经网络模型对有遮挡和模糊等情况的样本具备更强的鲁棒性。
-
公开(公告)号:CN116363290A
公开(公告)日:2023-06-30
申请号:CN202111622432.2
申请日:2021-12-28
Applicant: 复旦大学
Abstract: 本发明提供了一种用于大规模场景三维重建的纹理贴图生成方法,包括以下步骤:步骤1,基于三维重建方法对目标场景进行稠密三维重建并生成三维模型,根据三维重建过程中计算得到的相机位姿划分不同重建区域,在每个重建区域内选取清晰的RGB图像作为关键帧图像;步骤2,将三维模型渲染为三角化网格模型,并基于相机位姿用透视变换对共视点计算纹理映射,逐像素地对多视图的关键帧图像取对应RGB值并混合;步骤3,将三角化网格模型的三角面片以紧致的排布方式存放在连续的内存空间,得到纹理贴图以及纹理映射坐标。
-
-
-
-
-
-
-
-
-