无数据知识蒸馏学习方法、装置、设备及存储介质

    公开(公告)号:CN119783735A

    公开(公告)日:2025-04-08

    申请号:CN202411756581.1

    申请日:2024-11-29

    Abstract: 本申请实施例提供了一种无数据知识蒸馏学习方法、装置、设备及存储介质,属于知识蒸馏技术领域。该方法包括:在当前迭代轮次下,基于当前迭代次数确定至少一个生成器损失权重并计算得到生成器损失值,利用生成器损失值对生成器参数进行调整,得到当前迭代轮次下训练好的更新生成器;基于当前迭代次数确定至少一个学生模型损失权重并计算得到学生模型损失值;利用学生模型损失值对学生模型参数进行调整,得到当前迭代轮次下训练好的更新学生模型;其中,生成器损失权重和学生模型损失权重均随迭代次数的增加呈整体动态增大的趋势;重复执行对生成器和学生模型的训练,直至迭代次数到达预设确定最后一迭代轮次得到的更新学生模型为目标学生模型。

    细胞测序数据分类方法、系统及相关设备

    公开(公告)号:CN118658518A

    公开(公告)日:2024-09-17

    申请号:CN202410610927.0

    申请日:2024-05-16

    Abstract: 本申请公开了一种细胞测序数据分类方法、系统及相关设备,涉及生物学技术领域,方法先在服务端利用第一细胞测序数据样本对预设分类模型进行云端训练,然后将预训练模型发送至客户端,客户端基于第三细胞测序数据样本对预训练模型进行训练,得到中间参数集,并将中间参数集发送到服务端,服务端基于多个中间参数集对预训练模型进行更新,得到候选分类模型;利用第二细胞测序数据样本对候选分类模型进行验证,得到目标分类模型。本申请在无需公开存储于客户端的细胞测序数据的情况下,目标分类模型采用了各个客户端的第三细胞测序数据样本进行训练,提高了模型的训练规模,提高目标分类模型对于细胞测序数据的准确率。

    分子动力学模拟加速方法、电子设备及存储介质

    公开(公告)号:CN117116368A

    公开(公告)日:2023-11-24

    申请号:CN202310976931.4

    申请日:2023-08-03

    Abstract: 本申请公开了分子动力学模拟加速方法、电子设备及存储介质,涉及生物信息技术领域,其中训练方法包括:获取目标分子基于力场的目标运动轨迹信息;根据所述目标运动轨迹信息,生成每帧原子位置对应的目标内坐标;其中,所述目标内坐标用于表征每个原子之间的依赖关系;将所述目标内坐标输入至预设的所述自编码器进行降维处理,得到目标隐藏向量;将所述目标隐藏向量集输入至预设的时序模型中,得到分子动态变化过程;其中,所述时序模型为Transformer模型。本申请使用Transformer模型代替现有RNN模型对分子时序隐藏向量动态过程进行建模,能够提高模型的推理速度,从而提高了计算效率。

    一种针对分子三维结构的分子属性预测模型训练方法

    公开(公告)号:CN115456174A

    公开(公告)日:2022-12-09

    申请号:CN202211200959.0

    申请日:2022-09-29

    Abstract: 本发明公开了一种针对分子三维结构的分子属性预测模型训练方法。本发明利用现有的多个已经训练完成的预测精度较低的模型为分子三维结构的未标注数据集提供伪标签,基于包含伪标签的数据集对以分子三维结构为输入的神经网络模型进行训练,基于少量有标注的分子低维结构数据确定伪标签数据集的训练权重,同时采用上述少量有标注数据集的分子三维结构数据进一步提升模型的预测效果。解决了现有技术中由于带分子属性标签的分子三维结构的数据集很少,因此难以获得以分子三维结构为输入的训练效果好的分子属性预测模型的问题。

    基于增量学习的分子表征学习方法、系统、设备及介质

    公开(公告)号:CN117133379A

    公开(公告)日:2023-11-28

    申请号:CN202310915547.3

    申请日:2023-07-24

    Abstract: 本申请实施例提供了一种基于增量学习的分子表征学习方法、系统、设备及介质,属于机器学习技术领域。方法包括:构建第一分子表征模型;获取新增的分子数据集,对分子数据集的分子进行预处理,通过第一分子表征模型对分子进行表征提取得到与分子对应的第一原子表征、第二原子表征、第三原子表征;根据第一原子表征、第二原子表征构建对比学习损失值,根据第三原子表征构建基于上下文损失值,以及根据第一模型参数、第二模型参数构建正则项;根据对比学习损失值、基于上下文损失值、正则项构建联合损失值;根据联合损失值对第一分子表征模型进行迭代优化,得到完成预训练的第一分子表征模型。本申请能够降低模型的训练时间,以及降低算力的耗费。

Patent Agency Ranking