一种适用于医学图像分类的神经网络训练方法及系统

    公开(公告)号:CN118470490A

    公开(公告)日:2024-08-09

    申请号:CN202410595799.7

    申请日:2024-05-14

    Inventor: 曾少宁 刘翔

    Abstract: 本发明属于医学图像分类技术领域,公开了一种适用于医学图像分类的神经网络训练方法。本发明采用一种新颖的神经网络训练方法,对候选病人的CT图像进行结节或非结节自动分类。使用了一种独特的预处理方式,对训练中使用的图像加入了时序信息,相比于单张CT图像输入,能够加入更多的辅助信息以提升准确率。将自适应损失函数应用到训练过程中,以提高模型的分类精度,有效改善了分类识别精度。由于在训练过程中损失函数能够更好地区分困难样本和简单样本,在训练前期关注简单样本,训练后期能够更加侧重于困难样本,能够使模型更快地收敛,且准确率往往更高。

    一种水下目标检测方法
    2.
    发明公开

    公开(公告)号:CN117876856A

    公开(公告)日:2024-04-12

    申请号:CN202311678900.7

    申请日:2023-12-07

    Abstract: 本发明公开了一种水下目标检测方法,包括获取待检测水下图像;构建水下目标检测模型;所述水下目标检测模型包括双分支特征提取网络、多尺度特征融合网络和预测网络;所述双分支特征提取网络包括在C2f模块添加CBAM模块的骨干网络和小波变换网络;利用骨干网络进行全局特征提取,获得第一、二、三特征图;利用小波变换网络进行细节特征提取,获得第四特征图,并将第一特征图与第四特征图进行通道拼接获得第五特征图;利用多尺度特征融合网络对第二、三、五特征图进行融合,生成用于检测不同尺寸目标的第六、七、八特征图;利用预测网络根据第六、七、八特征图预测待检测水下图像的类别。本发明能够增加融合特征中的特征信息,从而提高模型检测准确度。

    一种基于神经网络的古生物图像生成方法

    公开(公告)号:CN115908461A

    公开(公告)日:2023-04-04

    申请号:CN202211423802.4

    申请日:2022-11-14

    Abstract: 本发明公开了一种基于神经网络的古生物图像生成方法,包括获取古生物图像数据集和非古生物图像数据集;对古生物图像数据集和非古生物图像数据集进行预处理;将预处理后的古生物图像数据集和非古生物图像数据集进行视角图像分割处理,根据分割结果训练生成对抗网络Style GAN;利用训练后的生成对抗网络Style GAN生成第一视角图像,并与视角图像分割得到的第二视角图像进行拼接,生成新的古生物图像。本发明通过对古生物图像数据集和非古生物图像数据集进行视角图像分割后训练生成对抗网络Style GAN,从而能够生成清晰的对抗图像,并且保证图像信息更加完整。

    一种基于多重会话感知的超图推荐方法

    公开(公告)号:CN115631005A

    公开(公告)日:2023-01-20

    申请号:CN202211307723.7

    申请日:2022-10-24

    Abstract: 本发明公开了一种基于多重会话感知的超图推荐方法,利用超图获得物品间的高阶关系表征,并结合共现图和局部会话图,获得会话内和会话间的物品关联性表征,通过利用门控机制挖掘多个会话间互益的信息,自适应的捕获到会话行为序列中物品的依赖关系,进而为用户提供更精确的推荐结果。本发明利用超图天然的性质,对会话中复杂的多元关系进行建模,通过保持序列信息缓解超边同构问题。本发明通过建立共现图结构和局部会话图结构,实现对不同会话中相似的用户意图和相同会话中潜在的行为模式之间的连接,能够探索复杂的跨会话和会话内部中行为模式的相互影响力。

    一种基于多模态Agent的图像分类数据构建方法

    公开(公告)号:CN119992195A

    公开(公告)日:2025-05-13

    申请号:CN202510082819.5

    申请日:2025-01-20

    Abstract: 本发明公开了一种基于多模态Agent的图像分类数据构建方法,包括以下步骤:输入图像、数据集信息:包括:1)从多种渠道收集的图像数据、照片及视频格式,连同预期的图像分类数据集的详细信息;2)直接输入数据集名称;Agent将执行在线搜索并整合预训练的模型数据以检索相关的数据集信息;用户根据提示输入其需求后,Agent开始与大模型互动,使模型能够利用提供的操作制定满足用户需求的计划,并将根据制定的计划自动调用操作,完成指定任务。本发明实现了图像分类数据集扩展和创建的全自动化和批量处理,显著减少了人力消耗,降低了数据集扩充与创建成本。与传统方法相比提高了操作效率,同时保持了高度的准确性。

    一种可扩展的增量式草坪视频分割方法、装置

    公开(公告)号:CN115937737A

    公开(公告)日:2023-04-07

    申请号:CN202211371436.2

    申请日:2022-11-03

    Abstract: 本发明提供了一种可扩展的增量式草坪视频分割方法、装置。通过对初始数据集执行第一处理,对Segformer模型进行训练,获得第一Segformer模型;对补充数据集执行第二处理,对第一Segformer模型进行训练,获得第二Segformer模型;获取历史采集的草坪场景的全景视频,并对全景视频执行抽帧展开以及锐化处理,获取展开图像集并对第二Segformer模型进行训练,获得第三Segformer模型;基于所述第二Segformer模型、或第三Segformer模型对后续草坪场景的视频执行语义分割处理。相比于现有技术,能够获取较多的带标签的草坪图像,同时对全景相机拍摄的全景图片使用极坐标展开、锐化等处理,并提出根据不同的视频执行基于不同的模型检测,提高全景图片的语义分割效果。

    一种基于shp文件的多框标注文件生成算法

    公开(公告)号:CN115729898A

    公开(公告)日:2023-03-03

    申请号:CN202211504610.6

    申请日:2022-11-29

    Abstract: 本发明提供了一种基于shp文件的多框标注文件生成算法,包括以下步骤:读取shp文件信息。加载shp标注文件,得到一个几何对象列表。遍历几何对象,记当前对象为main,获取main对象的数据;遍历几何对象,记当前对象为inner,进行判断和处理。遍历几何对象,记当前对象为sub,进行判断和处理。得到每一个几何对象及其邻近的几何对象的json格式的标注文件,每个标注文件至少包含number个几何对象。根据指定的包含几何框数量的不同,该方法可以生成不同大小和规模的json格式的标注信息。本发明利用shp文件构建训练数据集的标注图片,可以指定每张标注图片至少中包含几个完整的几何框,以达到用有限的数据产生多样的训练图片的目的。

    一种融合图像特征的三维点云场景分割方法及系统

    公开(公告)号:CN114255238B

    公开(公告)日:2025-04-29

    申请号:CN202111423794.9

    申请日:2021-11-26

    Abstract: 本发明提供了一种融合图像特征的三维点云场景分割方法及系统,涉及计算机视觉技术领域,能够实现二维图像和三维点云的有效融合,以及对三维场景的精准分割;该方法包括:S1、获取包括图像的二维数据、点云数据、深度数据并根据获取的数据计算得到场景图像与点云的关联关系;S2、对二维数据进行特征提取得到高维度的待融合特征图;S3、将待融合特征图和点云数据按照融合策略进行融合得到融合点云数据;融合策略包括:通过搜寻与某一点云数据邻近的像素,将该像素对应特征扭曲到该点云数据上;S4、将融合点云数据输入三维分割网络中进行特征提取,从而获得所需要的全局与局部的语义信息。本发明提供的技术方案适用于三维点云处理的过程中。

    基于隐私保护的联邦少样本学习的点云数据分类方法

    公开(公告)号:CN118918448A

    公开(公告)日:2024-11-08

    申请号:CN202410904311.4

    申请日:2024-07-08

    Abstract: 本发明公开了基于隐私保护的联邦少样本学习的点云数据分类方法,通过构建点云数据分类的本地模型,并基于获取的一组点云数据进行分类训练,将得到的本地模型参数传输至全局服务器,全局服务器结合其他节点的参数进行聚合,得到全局模型参数,基于全局模型参数更新本地模型参数;其中,本地模型通过嵌入层对点云数据支持集和查询集进行特征提取,将分别得到的局部原型特征和局部查询特征,通过注意力机制进行自适应地数据信息增强,得到注意力参数,基于注意力参数更新局部特征,全局服务器对各本地节点更新的局部特征进行聚合与分配,本地节点根据分配的全局特征,通过可学习层进行本地模型的分类预测。

Patent Agency Ranking