-
公开(公告)号:CN119228940B
公开(公告)日:2025-02-25
申请号:CN202411774131.5
申请日:2024-12-05
Applicant: 厦门理工学院
IPC: G06T11/00 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明提供了一种基于病理信息引导的扩散模型放大内镜图像生成方法,包括获取放大内镜的真实图像、Mask图像和病理信息文本提示,构建训练、测试数据集;构建基于病理信息引导的放大内镜图像生成模型通过训练数据集进行训练,得到训练好的放大内镜图像生成模型;利用测试数据集进行测试,评估其在未知数据上的性能,评估合格的即为最终得到的放大内镜图像生成模型;将最终得到的放大内镜图像生成模型应用于放大内镜图像生成工作,获取模型生成的放大内镜图像。该方法适用于关于放大内镜图片生成工作,利用病理信息和背景Mask图片引导的方式来精准生成不同病理的放大内镜图片,有效的解决了关于放大内镜图片下游分割和分类任务的数据不平衡问题。
-
公开(公告)号:CN119206279B
公开(公告)日:2025-02-25
申请号:CN202411729686.8
申请日:2024-11-29
Applicant: 厦门理工学院
IPC: G06V10/762 , G06V10/774 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本发明提供的一种基于不确定性与图神经网络的多视图聚类方法,涉及多视图聚类技术领域。本发明通过获取多视图数据集,进行预处理后,得到原始特征矩阵与邻接矩阵;对输入的所述原始特征矩阵和所述邻接矩阵进行特征提取与融合后,得到一致嵌入矩阵与转移矩阵;基于Dempster‑Shafer证据理论与狄利克雷分布,通过降低所述一致嵌入矩阵中嵌入空间的不确定性,得到可靠一致嵌入;将所述可靠一致嵌入与所述转移矩阵映射为最终嵌入;对所述最终嵌入进行解码重建与聚类分析,得到聚类结果。本发明能充分挖掘视图中的潜在信息,降低模型中的不确定性,解决了多视图聚类任务中存在的噪声问题,能够快速、高效、准确地得到多视图数据的聚类结果。
-
公开(公告)号:CN119380025A
公开(公告)日:2025-01-28
申请号:CN202411510319.9
申请日:2024-10-28
Applicant: 厦门理工学院
IPC: G06V10/26 , G06V10/82 , G06V10/774 , G06V10/764 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06N3/084 , G06N3/088 , G06N3/0895 , G06N3/09 , G06N3/094
Abstract: 本发明提出基于半监督学习和细节增强的图像分割方法及系统,包括以下步骤:收集医学图像并将部分数据进行标注;构建医学图像分割模型;将标注的图像输入医学图像分割模型计算其交叉熵损失;对未标注图像施加弱扰动与强扰动;将弱扰动图像和强扰动图像输入医学图像分割模型,弱扰动图像经过编码器输出后对其添加特征扰动策略,利用无标注数据所得输出结果计算一致性损失;设置模型总损失包括交叉熵损失与一致性损失;对总损失进行优化以及反向梯度传播,更新模型网络参数;将目标图像输入医学图像分割模型,所述医学图像分割模型输出目标图像每个像素点所属类别。本发明可提高医学图像分割的效率,实现更高精度和鲁棒性。
-
公开(公告)号:CN119360007A
公开(公告)日:2025-01-24
申请号:CN202411924702.9
申请日:2024-12-25
Applicant: 厦门理工学院
IPC: G06V10/25 , G06V10/44 , G06V10/74 , G06V10/764 , G06V10/774 , G06V20/70
Abstract: 本发明涉及一种基于自适应高斯学习标签分配的微小目标检测方法,包括:1)获取训练数据集和训练集标注文件;2)构建微小目标检测网络模型,包括基准检测器、自适应加权高斯度量模块和动态循环标签分配模块;通过基准检测器提取分类特征图和定位特征图分别用于分类和定位任务;对于定位特征图,利用自适应加权高斯度量模块获得真实框和特征点对应的高斯分布并度量相似度;在标签分配过程中,利用动态循环标签分配模块动态设置正负样本筛选的阈值;3)将微小目标检测网络模型用于检测目标。该方法及系统可以为候选先验提供与真实框更准确的相似度分数,并在标签分配过程中动态为真实框分配适当的正样本,从而提高微小目标检测的准确性。
-
公开(公告)号:CN118968034A
公开(公告)日:2024-11-15
申请号:CN202411154081.0
申请日:2024-08-21
Applicant: 厦门理工学院
IPC: G06V10/25 , G06V10/82 , G06V10/774 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/766
Abstract: 本发明涉及一种基于动态混合标签分配的端到端目标检测方法及系统,该方法包括以下步骤:1)获取训练数据集和训练集标注文件;2)构建基于动态混合标签分配的端到端目标检测网络模型,所述端到端目标检测模型包括初步特征提取模块、多尺度特征融合模块、检测头模块、混合样本选择模块和阶段感知软权重调整模块;通过训练数据集和训练集标注文件对端到端目标检测网络模型进行训练,得到可泛化的模型参数;3)将训练好的端到端目标检测网络模型用于检测目标,实现端到端目标检测。该方法不仅可以学习到稳健的特征表示,还能在推理过程中执行高效的端到端检测。
-
公开(公告)号:CN118898848A
公开(公告)日:2024-11-05
申请号:CN202411399838.2
申请日:2024-10-09
Applicant: 厦门理工学院
IPC: G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及一种基于色彩感知的文档图像阴影去除方法,该方法包括:获取用于训练的文档图像,构成训练集;构建端到端阴影去除模型,其中颜色感知背景提取网络从输入的阴影图像中提取背景特征并预测背景图像,阴影去除网络在第一阶段对输入的阴影图像利用背景特征生成粗略的阴影去除结果,再通过第二阶段进行细化,得到最终的去阴影图像;构建结合结构一致性损失、背景重建损失和外观一致性损失的损失函数,利用训练集对端到端阴影去除模型进行训练,通过训练优化模型参数;将训练完成的端到端阴影去除模型应用于新的文档图像,对文档图像自动进行阴影去除处理。该方法可有效去除文档图像中的阴影并保留文本细节,从而提高文档图像的可读性。
-
公开(公告)号:CN118898722A
公开(公告)日:2024-11-05
申请号:CN202411404225.3
申请日:2024-10-10
Applicant: 厦门理工学院
IPC: G06V10/422 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于几何基元空间感知的平面几何自动解题方法,S1将待求解的几何图示和几何题目利用解析器按预设的规则,解析成文本子句,并输入Transformer Encoder中编码;S2将几何图示图像通过卷机神经网络分成64个图示补丁特征并通过自注意力机制学习视觉模态内部特征;S3将这些模态特征输入到多模态双支路空间感知预训练语言模块中以学习跨模态全局特征和几何基元空间信息,并输入到双向GRU编码器中以执行融合编码;S4将混合编码中的文本编码送入点基元空间注意力模块中增强模型对几何基元的空间感知能力;S5将增强的混合编码由自限GRU解码器解码,并生成顺序求解程序。
-
公开(公告)号:CN118898560A
公开(公告)日:2024-11-05
申请号:CN202411398363.5
申请日:2024-10-09
Applicant: 厦门理工学院
IPC: G06T5/77 , G06T5/60 , G06T5/10 , G06N3/0455 , G06N3/0464
Abstract: 本发明提供了一种基于频域挖掘与调制的文档图像修复方法,其步骤如下:步骤S1:通过将退化图片分成多个编码块,得到相对应的特征矩阵。步骤S2:通过图像注意力模块和降采样模块结合的频域特征提取模块对于图像特征矩阵进行多次特征提取,并保存下来每一次的模块提取后的频域细节矩阵。步骤S3:将退化图片(带阴影的图片)输入频域注意力计算模块,并将之和对应的频域细节矩阵进行细化处理,然后进行上采样,重复多次,直到将图片恢复到和原本图片尺度差不多的图像。步骤S4:在最后将之输入到特征恢复模块,得到恢复图像的图片。步骤S5:将训练完成的网络应用于新的文档图像,自动进行阴影去除处理,输出清晰、无阴影的文档图像。
-
公开(公告)号:CN117523587A
公开(公告)日:2024-02-06
申请号:CN202311427150.6
申请日:2023-10-31
Applicant: 厦门理工学院
IPC: G06V30/242 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0442
Abstract: 本发明涉及一种基于字符敏感编辑距离的零样本汉字识别方法。汉字图像经过编码器,得到特征向量;特征向量分别经过解码器、部首计数模块,得到预测的汉字表意描述序列以及预测部首数量;汉字表意描述序列中的部首数量与预测部首数量相比较,形成代价门控用来约束编辑距离中的插入代价和删除代价。通过查找结构、笔画数、偏旁和四角号码字典信息,获得每个部首对之间的相似度作为替换代价;汉字表意描述序列和IDS字典中的每个候选序列经过编辑距离获得相似得分;选取相似得分最高的候选序列所对应的汉字为最终汉字。本发明方法消除了模型错误识别成相似部首和模型过解析或欠解析造成的部首序列失匹配的影响,有效地提高了对未见汉字的识别能力。
-
公开(公告)号:CN117197157A
公开(公告)日:2023-12-08
申请号:CN202310059519.6
申请日:2023-01-16
Applicant: 厦门理工学院
Abstract: 本发明涉及基于网格区域指导的交互式图像分割方法,包括,步骤S1:获取待处理图像,并根据分割目标属性选择网格大小;步骤S2:在待处理图像上覆盖步骤S1选择的相应大小的网格区域;步骤S3:在交互选择时,实时判断点击行为和移动轨迹,记录并可视化反馈用户选择的网格区域;步骤S4:确认完成所有选择后,将记录的选择区域转化为高斯距离图,生成正负指导,和原图拼接后,得到输入数据;步骤S5:构建分割网络并训练,将训练好的分割网络根据输入数据对目标进行分割,返回初始的分割结果;步骤S6:基于初始的分割结果,根据预设大小的正方形框对错误区域进行校正框选;步骤S7:根据校正框选的区域对交互指导做出修改,重新输入网络分割,并返回细化结果。
-
-
-
-
-
-
-
-
-