文本分类模型的训练方法、文本分类方法及装置

    公开(公告)号:CN117076672A

    公开(公告)日:2023-11-17

    申请号:CN202311016423.8

    申请日:2023-08-11

    Abstract: 本申请提供体一种文本分类模型的训练方法、文本分类方法及装置,包括:利用带标签的第一文本样本对第一文本分类模型进行训练,以获得训练好的第一文本分类模型;将无标签的第二文本样本输入训练好的第一文本分类模型,预测得到与第二文本样本对应的伪标签;利用第二文本样本对第二文本分类模型中的编码器进行对比学习,获得训练好的编码器;将第二文本样本输入至训练好的编码器,获得文本特征向量;利用文本特征向量以及伪标签对第二文本分类模型中的分类器进行训练,获得训练好的分类器。本申请能够降低长尾数据这种因为数据质量差所带来的模型性能影响,为提升分类性能,并且充分利用了大量的无标签数据,降低人工标注成本。

    一种基于公式学习的大模型微调方法、装置及存储介质

    公开(公告)号:CN118378592B

    公开(公告)日:2024-08-16

    申请号:CN202410803845.8

    申请日:2024-06-20

    Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。

    一种基于等离子体的反演代理模型训练方法及装置

    公开(公告)号:CN117933069B

    公开(公告)日:2024-07-12

    申请号:CN202410021830.6

    申请日:2024-01-05

    Abstract: 本说明书公开了一种基于等离子体的反演代理模型训练方法及装置,获取采样信号序列,该采样信号序列是预先在若干个采样时刻,对等离子体产生的软X波段辐射进行采样得到的,每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软X波段辐射进行采样得到的,获取该等离子体在每个采样时刻的辐射分布剖面标注。将采样信号序列输入第一特征提取层,得到第一信号特征,将第一信号特征输入第二特征提取层,得到第二信号特征。将第二信号特征输入结果预测层,得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。根据辐射分布剖面预测结果与辐射分布剖面标注,确定损失,根据损失,对反演代理模型进行训练。

    一种基于核聚变领域大模型的等离子体破裂归因方法

    公开(公告)号:CN118132944A

    公开(公告)日:2024-06-04

    申请号:CN202311363768.0

    申请日:2023-10-19

    Abstract: 本说明书公开了一种基于核聚变领域大模型的等离子体破裂归因方法,根据可控核聚变实验的实验数据通过多模态判别器确定破裂先兆事件、破裂先兆事件的发生时刻及发生置信度,并通过核聚变大模型基于破裂先兆事件、破裂先兆事件的发生时刻及发生置信度确定各破裂先兆事件之间的连接关系,并以此确定可控核聚变实验对应的破裂事件链,从而根据破裂事件链确定等离子体破裂的原因。可见,通过上述方案,通过核聚变大模型和多模态判别器充分利用可控核聚变多模态、碎片化的实验数据和专家经验,实现对等离子体破裂原因的分析,进而基于等离子体破裂的原因确定下一次实验的控制决策,从而提升可控核聚变实验的迭代效率。

    面向对象设计原则自动检测方法和装置

    公开(公告)号:CN117555590B

    公开(公告)日:2024-05-14

    申请号:CN202311421584.5

    申请日:2023-10-26

    Abstract: 本申请涉及一种面向对象设计原则自动检测方法和装置。该方法包括:对待检测的面向对象程序源码进行设计原则符合性检测,得到符合性检测评分值;其中,设计原则符合性检测包括迪米特法则符合性检测、依赖倒置原则符合性检测、接口隔离原则符合性检测、合成复用原则符合性检测以及里氏替换原则符合性检测;基于预设的设计原则评分权重和各项符合性检测评分值,得到面向对象程序源码的符合性总评分。采用本方法能够快速准确的对面向对象设计原则符合性进行检测及评价,得出总体评价分数,在软件开发编码阶段即可对软件设计质量有直观参考,明确后续软件质量提升方向,避免软件上线后可能造成的扩展和维护难度高、成本高的问题。

    模型训练的方法、图像识别的方法、装置及电子设备

    公开(公告)号:CN118644697A

    公开(公告)日:2024-09-13

    申请号:CN202410563863.3

    申请日:2024-05-08

    Abstract: 本说明书提供了模型训练的方法、图像识别的方法、装置及电子设备,通过将获取到的样本图像输入到图像识别模型中,可以通过图像识别模型,随机生成针对特征提取层的各特征提取窗口,以通过各特征提取窗口,对样本图像进行特征提取,并将每个特征提取窗口提取出的子特征图按照不重叠的方式进行组合,得到与样本图像尺寸相同的特征图,将该特征图输入到图像识别模型中的识别层中,得到识别结果,并以最小化该识别结果与样本图像对应的标签结果之间的偏差为优化目标,对图像识别模型进行训练。

    一种基于公式学习的大模型微调方法、装置及存储介质

    公开(公告)号:CN118378592A

    公开(公告)日:2024-07-23

    申请号:CN202410803845.8

    申请日:2024-06-20

    Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。

Patent Agency Ranking