-
公开(公告)号:CN117076672A
公开(公告)日:2023-11-17
申请号:CN202311016423.8
申请日:2023-08-11
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/24 , G06N3/0442 , G06N3/08
Abstract: 本申请提供体一种文本分类模型的训练方法、文本分类方法及装置,包括:利用带标签的第一文本样本对第一文本分类模型进行训练,以获得训练好的第一文本分类模型;将无标签的第二文本样本输入训练好的第一文本分类模型,预测得到与第二文本样本对应的伪标签;利用第二文本样本对第二文本分类模型中的编码器进行对比学习,获得训练好的编码器;将第二文本样本输入至训练好的编码器,获得文本特征向量;利用文本特征向量以及伪标签对第二文本分类模型中的分类器进行训练,获得训练好的分类器。本申请能够降低长尾数据这种因为数据质量差所带来的模型性能影响,为提升分类性能,并且充分利用了大量的无标签数据,降低人工标注成本。
-
公开(公告)号:CN118839053A
公开(公告)日:2024-10-25
申请号:CN202411321148.5
申请日:2024-09-23
Applicant: 之江实验室
IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186
Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练,所述方法包括:确定目标场景模板和目标关键词;将所述目标关键词填充到所述目标场景模板中,调用通用的大语言模型,生成多个搜索词句;调用搜索服务,基于所述搜索词句生成第一URL列表;基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。
-
公开(公告)号:CN118378592B
公开(公告)日:2024-08-16
申请号:CN202410803845.8
申请日:2024-06-20
Applicant: 之江实验室
IPC: G06F40/117 , G06N5/04 , G06F40/151
Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。
-
公开(公告)号:CN117933069B
公开(公告)日:2024-07-12
申请号:CN202410021830.6
申请日:2024-01-05
Applicant: 之江实验室
IPC: G06F30/27 , G21B1/25 , G06F18/213 , G06N3/045 , G06N3/08 , G01T1/29 , G06F113/08
Abstract: 本说明书公开了一种基于等离子体的反演代理模型训练方法及装置,获取采样信号序列,该采样信号序列是预先在若干个采样时刻,对等离子体产生的软X波段辐射进行采样得到的,每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软X波段辐射进行采样得到的,获取该等离子体在每个采样时刻的辐射分布剖面标注。将采样信号序列输入第一特征提取层,得到第一信号特征,将第一信号特征输入第二特征提取层,得到第二信号特征。将第二信号特征输入结果预测层,得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。根据辐射分布剖面预测结果与辐射分布剖面标注,确定损失,根据损失,对反演代理模型进行训练。
-
公开(公告)号:CN117933070B
公开(公告)日:2024-07-05
申请号:CN202410022577.6
申请日:2024-01-05
Applicant: 之江实验室
IPC: G06F30/27 , G01T1/16 , G06F18/213 , G06F18/214 , G06N3/045 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F123/02 , G06F113/08
Abstract: 本说明书公开了一种辐射分布预测模型的训练方法、装置及存储介质,该辐射分布预测模型包括第一特征提取层、第一权重调整层及辐射分布输出层,通过第一特征提取层提取该采样信号序列的特征,该第一特征提取层提取的特征包含时间信息。此外,通过第一权重调整层可对提取的特征进行权重调整,以提高输出的预测辐射分布的准确性。最终,通过辐射分布输出层提取时序特征,这是由于采样信号序列包括了时间信息,因此,可获取到辐射分布的时序演化规律,提取时序特征。根据该时序特征,得到预测的每个时刻对应的等离子体的预测辐射分布图像。通过辐射分布预测模型构架辐射分布图像,提高了构建辐射分布图像的效率及准确性。
-
公开(公告)号:CN118132944A
公开(公告)日:2024-06-04
申请号:CN202311363768.0
申请日:2023-10-19
Applicant: 之江实验室
IPC: G06F18/20 , G06F18/214 , G06N3/092
Abstract: 本说明书公开了一种基于核聚变领域大模型的等离子体破裂归因方法,根据可控核聚变实验的实验数据通过多模态判别器确定破裂先兆事件、破裂先兆事件的发生时刻及发生置信度,并通过核聚变大模型基于破裂先兆事件、破裂先兆事件的发生时刻及发生置信度确定各破裂先兆事件之间的连接关系,并以此确定可控核聚变实验对应的破裂事件链,从而根据破裂事件链确定等离子体破裂的原因。可见,通过上述方案,通过核聚变大模型和多模态判别器充分利用可控核聚变多模态、碎片化的实验数据和专家经验,实现对等离子体破裂原因的分析,进而基于等离子体破裂的原因确定下一次实验的控制决策,从而提升可控核聚变实验的迭代效率。
-
公开(公告)号:CN117555590B
公开(公告)日:2024-05-14
申请号:CN202311421584.5
申请日:2023-10-26
Applicant: 之江实验室
Abstract: 本申请涉及一种面向对象设计原则自动检测方法和装置。该方法包括:对待检测的面向对象程序源码进行设计原则符合性检测,得到符合性检测评分值;其中,设计原则符合性检测包括迪米特法则符合性检测、依赖倒置原则符合性检测、接口隔离原则符合性检测、合成复用原则符合性检测以及里氏替换原则符合性检测;基于预设的设计原则评分权重和各项符合性检测评分值,得到面向对象程序源码的符合性总评分。采用本方法能够快速准确的对面向对象设计原则符合性进行检测及评价,得出总体评价分数,在软件开发编码阶段即可对软件设计质量有直观参考,明确后续软件质量提升方向,避免软件上线后可能造成的扩展和维护难度高、成本高的问题。
-
公开(公告)号:CN117494800A
公开(公告)日:2024-02-02
申请号:CN202311206289.8
申请日:2023-09-18
Applicant: 之江实验室 , 核工业西南物理研究院
IPC: G06N5/022
Abstract: 本说明书公开了一种基于构建出的核聚变知识图谱的任务执行方法及装置,通过语料获取到实体名称信息之后,即可根据以核聚变领域内语料训练过的目标模型对实体名称信息间的相关性信息进行判断,无需人工进行对其的判断过程。并且在获取相关性信息之后,可进一步构建出核聚变知识图谱,通过核聚变知识图谱对实验任务进行任务分析,大量减少任务分析所需的时间,提高任务执行效率。
-
公开(公告)号:CN118644697A
公开(公告)日:2024-09-13
申请号:CN202410563863.3
申请日:2024-05-08
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/42
Abstract: 本说明书提供了模型训练的方法、图像识别的方法、装置及电子设备,通过将获取到的样本图像输入到图像识别模型中,可以通过图像识别模型,随机生成针对特征提取层的各特征提取窗口,以通过各特征提取窗口,对样本图像进行特征提取,并将每个特征提取窗口提取出的子特征图按照不重叠的方式进行组合,得到与样本图像尺寸相同的特征图,将该特征图输入到图像识别模型中的识别层中,得到识别结果,并以最小化该识别结果与样本图像对应的标签结果之间的偏差为优化目标,对图像识别模型进行训练。
-
公开(公告)号:CN118378592A
公开(公告)日:2024-07-23
申请号:CN202410803845.8
申请日:2024-06-20
Applicant: 之江实验室
IPC: G06F40/117 , G06N5/04 , G06F40/151
Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。
-
-
-
-
-
-
-
-
-