基于双重自适应邻域半径的多粒度乳腺癌基因分类方法

    公开(公告)号:CN113838532A

    公开(公告)日:2021-12-24

    申请号:CN202110845531.0

    申请日:2021-07-26

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于双重自适应邻域半径的多粒度乳腺癌基因分类方法,读取大规模基因位点数据并做归一化处理,并对大规模基因位点进行数据分析;利用轮廓系数和PCA降维可视化相结合方式,选取最佳K值,调整信息粒化的模型;其次,使用启发式约简算法分别实现基于簇心距离自适应邻域半径的多粒度属性约简基于属性包含度的邻域半径的多粒度属性约简,并采用SVM支持向量机机器学习分类算法对乳腺癌基因大数据进行分类和预测。本发明的有益效果是:调整惩罚项使模型在乳腺癌基因分类具有较高的准确率和召回率,去除大规模数据中冗余属性,提高了计算效率,利用样本之间的支持信息,提升了乳腺癌数据分类的效率和精度。

    用于大规模脑核磁分割的最大熵多阈值蚁群进化Spark方法

    公开(公告)号:CN113744228A

    公开(公告)日:2021-12-03

    申请号:CN202110995542.7

    申请日:2021-08-27

    Applicant: 南通大学

    Abstract: 本发明提供了一种用于大规模脑核磁分割的最大熵多阈值蚁群进化Spark方法,属于医学信息智能处理区域技术领域。其技术方案为:首先,读取大规模脑核磁图像数据,并进行预处理操作,然后,设计改进的蚁群算法,将脑核磁图像的灰度级作为路径上的节点,蚂蚁经过的灰度级节点作为分割的阈值组,将Kapur熵作为目标函数;最后,搭建Spark框架,将改进的蚁群算法封装在可并行计算的RDD集合中,进行并行处理,得到最佳阈值组,并根据阈值组进行脑核磁图像的阈值分割。本发明的有益效果为:能够有效提高对大规模脑核磁图像信息提取的效率和精度,对脑核磁数据计算机智能辅助处理具有较强的应用价值。

    大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法

    公开(公告)号:CN113012776A

    公开(公告)日:2021-06-22

    申请号:CN202110341531.7

    申请日:2021-03-30

    Applicant: 南通大学

    Abstract: 本发明提供了一种大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法,在主节点上读取糖尿病数据,并按照4:1比例将糖尿病数据划分为训练集和测试集;在子节点上对糖尿病训练集通过Spark并行欠采样获得多个新的训练子集;在子节点上通过Spark并行病理特征约简器得到病理特征约简子集,并更新每个子节点上训练子集和测试子集的病理特征集,在子节点上,通过邻域证据Spark并行分类器获得测试子集的预测类别标签集合,在主节点上根据投票机制得到最终的预测类别标签。本发明的有益效果为:本发明去除大规模数据中冗余属性,提高了计算效率,充分地利用了样本之间的支持信息,提升了糖尿病数据分类的效率和精度。

    一种用于眼底棉绒斑图像分割的自适应超像素FCM方法

    公开(公告)号:CN112907604A

    公开(公告)日:2021-06-04

    申请号:CN202110281472.9

    申请日:2021-03-16

    Applicant: 南通大学

    Abstract: 本发明提供了一种用于眼底棉绒斑图像分割的自适应超像素FCM方法,包括:S10、人为等比例裁剪出棉绒斑病变图像的病变区域;S20、对棉绒斑病变图像进行超像素处理,并将超像素点作为自适应FCM样本;S30、使用衍生多种群遗传算法优化自适应FCM聚类中心;S40、计算出聚类之后的逐像素损失值,回调参数;S50、形成眼底棉绒斑图像分割的遗传FCM聚类模型,输入眼底图像,既能输出分割后的眼底棉绒斑病变区域图像。本发明的一种用于眼底棉绒斑图像分割的自适应超像素FCM方法,大大降低了运行时间,提升图像分割时的精度,为相关糖尿病视网膜棉绒斑病变疾病的临床诊断和治疗提供重要的影像特征依据。

    一种基于双编码器的多层级有机化学反应的预测方法

    公开(公告)号:CN119479866A

    公开(公告)日:2025-02-18

    申请号:CN202411650892.X

    申请日:2024-11-19

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于双编码器的多层级有机化学反应的预测方法,属于机器学习辅助有机化学技术领域。解决了Transformer模型缺少对分子间相互作用的关注、编码不足和泛化能力不强的技术问题。其技术方案:包括以下步骤:S10、对化学反应SMILES序列数据集进行预处理;S20、利用原子编码器和分子编码器分别对输入化学反应进行特征提取;S30、在原子和分子特征表示上运用多层次特征融合;S40、模型预测结果与目标得到的loss和对比学习的loss进行权重相加,训练模型;S50、运用训练好的模型预测化学产物。本发明的有益效果为:提高化学产物预测的准确率,提升模型的泛化能力。

    面向不完整多模态数据的模糊知识蒸馏方法

    公开(公告)号:CN118136269B

    公开(公告)日:2025-01-28

    申请号:CN202410284924.2

    申请日:2024-03-13

    Applicant: 南通大学

    Abstract: 本发明提供了面向不完整多模态数据的模糊知识蒸馏方法,属于医学信息智能诊断技术领域,解决了知识蒸馏过程中教师模型和学生模型之间模型能力不匹配的技术问题。其技术方案为:包括以下步骤:S1、使用由Kawahara提出的边到边卷积E2E,边到节点卷积E2N,节点到图卷积N2G获取每一步的特征图;S2、获得经过概括和选择的信息;S3、设计了三类损失函数,分别为表示损失、预测分布损失和交叉熵损失;S4、通过最小化三类损失函数,对学生网络进行训练。本发明的有益效果为:本发明可以显著提高在模态缺失情况下模型对精神疾病识别的准确率,辅助医生进行诊断分析,给患者带来更好的医疗服务。

    用于精神分裂疾病检测的两阶段模糊邻域特征选择方法

    公开(公告)号:CN119206241A

    公开(公告)日:2024-12-27

    申请号:CN202411217898.8

    申请日:2024-09-02

    Applicant: 南通大学

    Abstract: 本发明提供了一种用于精神分裂疾病检测的两阶段模糊邻域特征选择方法,属于医学信息智能处理技术领域。解决了传统方法在处理高维数据特征选择中全局搜索能力不足以及选择效率低下,并且复杂的精神分裂疾病特征选择中会存在不确定、模糊的技术问题。其技术方案为:包括以下步骤:S1:精神分裂疾病数据的获取与预处理;S2:根据数据构建模糊邻域决策空间与模糊邻域互信息;S3:模糊邻域差分进化的精神分裂疾病特征选择模块;S4:模糊邻域决策树的精神分裂疾病特征选择模块;S5:将两阶段的特征选择融合。本发明的有益效果为:能够有效处理数据中的不确定性,并且提高在高维空间的全局搜素能力以及选择效率。

Patent Agency Ranking