一种诊断代理模型的训练方法、装置、介质及电子设备

    公开(公告)号:CN118861824A

    公开(公告)日:2024-10-29

    申请号:CN202411102196.5

    申请日:2024-08-12

    Abstract: 本说明书公开了一种诊断代理模型的训练方法、装置、介质及电子设备,该方法包括:将等离子体的第一测量信号输入待训练的诊断代理模型的嵌入层,确定第一信号向量。将第一测量信号对应的测量光路的第一弦积分信息输入嵌入层,确定第一位置向量。将等离子体的第一物理边界输入嵌入层,确定第一区域向量。将第一信号向量、第一位置向量和第一区域向量输入待训练的诊断代理模型的编码层,确定第一编码特征。根据第一编码特征,确定第一预测剖面。根据第一预测剖面和等离子体的二维物理参数剖面,对待训练的诊断代理模型进行训练,可使得诊断代理模型更好地学习测量信号和物理信息之间的内在联系和规律,从而精确地推断出等离子体的物理参数。

    一种基于等离子体的反演代理模型训练方法及装置

    公开(公告)号:CN117933069B

    公开(公告)日:2024-07-12

    申请号:CN202410021830.6

    申请日:2024-01-05

    Abstract: 本说明书公开了一种基于等离子体的反演代理模型训练方法及装置,获取采样信号序列,该采样信号序列是预先在若干个采样时刻,对等离子体产生的软X波段辐射进行采样得到的,每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软X波段辐射进行采样得到的,获取该等离子体在每个采样时刻的辐射分布剖面标注。将采样信号序列输入第一特征提取层,得到第一信号特征,将第一信号特征输入第二特征提取层,得到第二信号特征。将第二信号特征输入结果预测层,得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。根据辐射分布剖面预测结果与辐射分布剖面标注,确定损失,根据损失,对反演代理模型进行训练。

    面向图神经网络的鲁棒神经架构搜索方法及其系统

    公开(公告)号:CN115018057A

    公开(公告)日:2022-09-06

    申请号:CN202210744891.6

    申请日:2022-06-28

    Abstract: 本发明公开了一种面向图神经网络的鲁棒神经架构搜索方法及其系统,搜索方法包括定义搜索单元、搜索空间和GNN架构;在搜索空间中搜索若干GNN架构,并对所有的GNN架构进行训练;采用对抗攻击方法生成对抗样本,将对抗样本输入每个已训练的GNN架构,将输出的准确率作为其鲁棒性指标;根据GNN架构的鲁棒性指标,搜索出具有相邻下标的GNN架构中满足预设条件的搜索单元,并存储至搜索单元集合;根据搜索单元集合B*中的搜索单元,采用概率增强搜索策略搜索搜索空间中每条边最大权重对应的操作;采用搜索出的每条边的最大权重对应的操作构建形成GNN神经网络架构。

    一种基于注意力选择的transformer运算精简方法及装置

    公开(公告)号:CN114494791B

    公开(公告)日:2022-07-08

    申请号:CN202210353591.5

    申请日:2022-04-06

    Abstract: 本发明提出了一种基于注意力选择的transformer运算精简方法,在transformer网络的每层用注意力机制获取关联矩阵,对关联矩阵的每一行计算信息熵,获得各个局部标识对于网络任务的重要性程度,将局部标识划分为重要标识和不重要标识,每间隔一定网络层,计算不重要标识的特征参数和,将不重要标识的特征参数值加到重要标识上,删除不重要标识,仅重要标识进入网络下一层。网络训练过程中,构建交叉熵损失函数和重要性损失函数,重要性损失函数用于降低重要标识与不重要标识的关联。本发明方法从影响网络任务的判别性区域的选择角度出发,实现方法简单,有效减少网络计算量的同时,对模型精度影响很小,且可以与已知网络压缩方法同时使用,共同实现计算量压缩。

    一种基于等离子体的反演代理模型训练方法及装置

    公开(公告)号:CN117933069A

    公开(公告)日:2024-04-26

    申请号:CN202410021830.6

    申请日:2024-01-05

    Abstract: 本说明书公开了一种基于等离子体的反演代理模型训练方法及装置,获取采样信号序列,该采样信号序列是预先在若干个采样时刻,对等离子体产生的软X波段辐射进行采样得到的,每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软X波段辐射进行采样得到的,获取该等离子体在每个采样时刻的辐射分布剖面标注。将采样信号序列输入第一特征提取层,得到第一信号特征,将第一信号特征输入第二特征提取层,得到第二信号特征。将第二信号特征输入结果预测层,得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。根据辐射分布剖面预测结果与辐射分布剖面标注,确定损失,根据损失,对反演代理模型进行训练。

    一种可控核聚变中因果图构建及破裂规避决策方法及装置

    公开(公告)号:CN117408334A

    公开(公告)日:2024-01-16

    申请号:CN202311205600.7

    申请日:2023-09-18

    Abstract: 本说明书公开了一种可控核聚变中因果图构建及破裂规避决策方法及装置,获取可控核聚变实验的实验数据,而后根据实验数据,确定基础因果图,因果图用于表征包含各先兆事件与破裂事件之间的因果关系,进而,针对基础因果图中每个先兆事件,确定该先兆事件与所述破裂事件之间的共因,基于与共因相关的实验数据,确定排除共因后该先兆事件与破裂事件之间的相关性得分,作为该先兆事件对应的相关性得分,基于各先兆事件对应的相关性得分筛选出目标事件,并基于筛选出的目标事件,对基础因果图进行更新,得到更新后因果图,从而,本方法能够通过构建出更加准确的因果图,得到破裂事件的诱因,能够有效地对可控核聚变实验中的破裂事件进行规避决策。

    一种针对多领域文本分类模型的模型训练的方法及装置

    公开(公告)号:CN117034926A

    公开(公告)日:2023-11-10

    申请号:CN202311038789.5

    申请日:2023-08-16

    Abstract: 本说明书公开了一种针对多领域文本分类模型的模型训练的方法及装置。由于先由多个专家网络层给出各自的第二编码向量,然后再将每个专家网络层给出的第二编码向量分别输入到各个子分类层中,并通过使每个子分类层给出的分类结果与每个子分类层各自对应的分类标签之间的偏差最小为目标,对文本分类模型进行训练,这使得在模型训练过程中,文本分类模型可以学习到各分类领域下的潜在关联,从而可以使得文本分类模型能够给出更为准确的分类结果,并且,由于该文本分类模型中包含有多个子分类层,这使得训练出该文本分类模型后,可以实现对各个分类领域下的文本数据进行分类的目的,从而极大的节省了训练成本。

    基于模态定制协同注意力交互的时序语言定位方法及装置

    公开(公告)号:CN115238130B

    公开(公告)日:2022-12-06

    申请号:CN202211149191.9

    申请日:2022-09-21

    Inventor: 王聪 宋明黎

    Abstract: 本发明公开了基于模态定制协同注意力交互的时序语言定位方法及装置,包括以下步骤:步骤S1:构建数据集;步骤S2:提取视频表征;步骤S3:得到多粒度查询表征Q;步骤S4:获取已语义对齐视频表征;步骤S5:获得每一帧处的目标片段时序边界回归值、语义匹配分数和时序交并比回归值;步骤S6:得到训练好的基于模态定制协同注意力交互的时序语言定位模型;步骤S7:测试,得到时序语言定位结果。本发明将配备协同注意力的Transformer架构用于时序语言定位任务,并设计了一种模态定制的双流协同注意力交互层,用于并行的视频流的多粒度协同注意力交互和查询流的标准协同注意力交互,本发明方法实现简单,手段灵活,可显著提升时序语言定位任务性能。

    文本分类模型的训练方法、文本分类方法及装置

    公开(公告)号:CN117076672A

    公开(公告)日:2023-11-17

    申请号:CN202311016423.8

    申请日:2023-08-11

    Abstract: 本申请提供体一种文本分类模型的训练方法、文本分类方法及装置,包括:利用带标签的第一文本样本对第一文本分类模型进行训练,以获得训练好的第一文本分类模型;将无标签的第二文本样本输入训练好的第一文本分类模型,预测得到与第二文本样本对应的伪标签;利用第二文本样本对第二文本分类模型中的编码器进行对比学习,获得训练好的编码器;将第二文本样本输入至训练好的编码器,获得文本特征向量;利用文本特征向量以及伪标签对第二文本分类模型中的分类器进行训练,获得训练好的分类器。本申请能够降低长尾数据这种因为数据质量差所带来的模型性能影响,为提升分类性能,并且充分利用了大量的无标签数据,降低人工标注成本。

Patent Agency Ranking