大规模肝脏电子病历病变分类的属性并行约简Spark方法

    公开(公告)号:CN111816270B

    公开(公告)日:2022-12-09

    申请号:CN202010558462.0

    申请日:2020-06-18

    Applicant: 南通大学

    Abstract: 本发明提供了大规模肝脏电子病历病变分类的属性并行约简Spark方法,包括如下步骤:S10读取肝脏电子病历的数据集合并划分成多个肝脏病历数据子集发送到相应从节点上;S20对所述肝脏病历数据子集进行不一致处理,约简肝脏病历数据中不一致的数据,然后计算肝脏病历数据属性的等价类划分值;S30根据肝脏病历数据子集中数据对象计算属性重要度;S40计算出所述从节点中肝脏病历数据子集的属性重要度集合,进行聚合操作,得到肝脏病历数据的属性重要度集合;S50计算肝脏病历数据集的属性约简集合,并判断其是否满足约简要求。本发明的大规模肝脏电子病历病变分类的属性并行约简Spark方法,有效提高大规模肝脏电子病历属性并行约简的效率和精度。

    大规模肝脏电子病历病变分类的属性并行约简Spark方法

    公开(公告)号:CN111816270A

    公开(公告)日:2020-10-23

    申请号:CN202010558462.0

    申请日:2020-06-18

    Applicant: 南通大学

    Abstract: 本发明提供了大规模肝脏电子病历病变分类的属性并行约简Spark方法,包括如下步骤:S10读取肝脏电子病历的数据集合并划分成多个肝脏病历数据子集发送到相应从节点上;S20对所述肝脏病历数据子集进行不一致处理,约简肝脏病历数据中不一致的数据,然后计算肝脏病历数据属性的等价类划分值;S30根据肝脏病历数据子集中数据对象计算属性重要度;S40计算出所述从节点中肝脏病历数据子集的属性重要度集合,进行聚合操作,得到肝脏病历数据的属性重要度集合;S50计算肝脏病历数据集的属性约简集合,并判断其是否满足约简要求。本发明的大规模肝脏电子病历病变分类的属性并行约简Spark方法,有效提高大规模肝脏电子病历属性并行约简的效率和精度。

    一种基于Spark平台的大规模眼底图像分类系统训练方法

    公开(公告)号:CN111612096A

    公开(公告)日:2020-09-01

    申请号:CN202010484386.3

    申请日:2020-06-01

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于Spark平台的大规模眼底图像分类系统训练方法,包括如下步骤:S10设置执行分布式卷积神经网络训练必要的参数;S20调用所述卷积神经网络算法程序,将所述参数代入算法程序,通过分布式蛙跳算法生成所述卷积神经网络训练时的初始权值;S30使用存储的标准图像数据对所述卷积神经网络训练,寻找出最优蛙,作为下次分组权值训练的初始权值,完成所述卷积神经网络的训练;以及S40保存训练完的所述卷积神经网络模型。本发明的一种基于Spark平台的大规模眼底图像分类系统训练方法,采用混合蛙跳算法生成网络初始权值,通过分组优化策略实现卷积神经网络的分布式并行训练,可有效提高大规模眼底图像在卷积神经网络训练时的高效性和分类的准确性。

Patent Agency Ranking