Patent search ap:("之江实验室") AND inv:"魏一雄" Page 2

11.

发明公开
文本分类模型的训练方法、文本分类方法及装置审中-实审

公开(公告)号：CN117076672A

公开(公告)日：2023-11-17

申请号：CN202311016423.8

申请日：2023-08-11

Applicant: 之江实验室

Inventor： 王智君 , 魏一雄 , 王聪 , 杨仁杰 , 曹靖楠

IPC: G06F16/35 , G06F18/24 , G06N3/0442 , G06N3/08

Abstract: 本申请提供体一种文本分类模型的训练方法、文本分类方法及装置，包括：利用带标签的第一文本样本对第一文本分类模型进行训练，以获得训练好的第一文本分类模型；将无标签的第二文本样本输入训练好的第一文本分类模型，预测得到与第二文本样本对应的伪标签；利用第二文本样本对第二文本分类模型中的编码器进行对比学习，获得训练好的编码器；将第二文本样本输入至训练好的编码器，获得文本特征向量；利用文本特征向量以及伪标签对第二文本分类模型中的分类器进行训练，获得训练好的分类器。本申请能够降低长尾数据这种因为数据质量差所带来的模型性能影响，为提升分类性能，并且充分利用了大量的无标签数据，降低人工标注成本。

12.

发明公开
网页数据采集方法、系统、计算机设备和可读存储介质有权

公开(公告)号：CN118839053A

公开(公告)日：2024-10-25

申请号：CN202411321148.5

申请日：2024-09-23

Applicant: 之江实验室

Inventor： 周子豪 , 王海平 , 程达 , 刘朝阳 , 魏一雄 , 邹常青 , 胡斌 , 杨仁杰

IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186

Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练，所述方法包括：确定目标场景模板和目标关键词；将所述目标关键词填充到所述目标场景模板中，调用通用的大语言模型，生成多个搜索词句；调用搜索服务，基于所述搜索词句生成第一URL列表；基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。

13.

发明授权
一种基于公式学习的大模型微调方法、装置及存储介质有权

公开(公告)号：CN118378592B

公开(公告)日：2024-08-16

申请号：CN202410803845.8

申请日：2024-06-20

Applicant: 之江实验室

Inventor： 王海平 , 高枫 , 邹常青 , 龙沁沁 , 王军 , 魏一雄

IPC: G06F40/117 , G06N5/04 , G06F40/151

Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质，获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式，根据该公式的上下文内容，确定目标文本并确定目标文本中的候选变量，在该公式中确定与候选变量一致的匹配变量，根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽，得到任务文本，根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本，根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量，对大模型进行微调，使大模型学习到公式中的变量与其解释之间的对应关系，从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。

14.

发明授权
一种基于等离子体的反演代理模型训练方法及装置有权

公开(公告)号：CN117933069B

公开(公告)日：2024-07-12

申请号：CN202410021830.6

申请日：2024-01-05

Applicant: 之江实验室

Inventor： 张泽宇 , 王智君 , 王聪 , 魏一雄 , 杨仁杰 , 陈云川 , 刘朝阳

IPC: G06F30/27 , G21B1/25 , G06F18/213 , G06N3/045 , G06N3/08 , G01T1/29 , G06F113/08

Abstract: 本说明书公开了一种基于等离子体的反演代理模型训练方法及装置，获取采样信号序列，该采样信号序列是预先在若干个采样时刻，对等离子体产生的软X波段辐射进行采样得到的，每个采样时刻对应的采样信号序列是在若干个采样位置，对等离子体产生的软X波段辐射进行采样得到的，获取该等离子体在每个采样时刻的辐射分布剖面标注。将采样信号序列输入第一特征提取层，得到第一信号特征，将第一信号特征输入第二特征提取层，得到第二信号特征。将第二信号特征输入结果预测层，得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。根据辐射分布剖面预测结果与辐射分布剖面标注，确定损失，根据损失，对反演代理模型进行训练。

15.

发明授权
一种辐射分布预测模型的训练方法、装置及存储介质有权

公开(公告)号：CN117933070B

公开(公告)日：2024-07-05

申请号：CN202410022577.6

申请日：2024-01-05

Applicant: 之江实验室

Inventor： 杨仁杰 , 王智君 , 魏一雄 , 张泽宇 , 王聪 , 王海平 , 魏宁 , 高超霖

IPC: G06F30/27 , G01T1/16 , G06F18/213 , G06F18/214 , G06N3/045 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F123/02 , G06F113/08

Abstract: 本说明书公开了一种辐射分布预测模型的训练方法、装置及存储介质，该辐射分布预测模型包括第一特征提取层、第一权重调整层及辐射分布输出层，通过第一特征提取层提取该采样信号序列的特征，该第一特征提取层提取的特征包含时间信息。此外，通过第一权重调整层可对提取的特征进行权重调整，以提高输出的预测辐射分布的准确性。最终，通过辐射分布输出层提取时序特征，这是由于采样信号序列包括了时间信息，因此，可获取到辐射分布的时序演化规律，提取时序特征。根据该时序特征，得到预测的每个时刻对应的等离子体的预测辐射分布图像。通过辐射分布预测模型构架辐射分布图像，提高了构建辐射分布图像的效率及准确性。

16.

发明公开
一种基于核聚变领域大模型的等离子体破裂归因方法审中-实审

公开(公告)号：CN118132944A

公开(公告)日：2024-06-04

申请号：CN202311363768.0

申请日：2023-10-19

Applicant: 之江实验室

Inventor： 王海平 , 高枫 , 汪涛 , 龙沁沁 , 魏宁 , 雪费德 , 吴烨茜 , 魏一雄

IPC: G06F18/20 , G06F18/214 , G06N3/092

Abstract: 本说明书公开了一种基于核聚变领域大模型的等离子体破裂归因方法，根据可控核聚变实验的实验数据通过多模态判别器确定破裂先兆事件、破裂先兆事件的发生时刻及发生置信度，并通过核聚变大模型基于破裂先兆事件、破裂先兆事件的发生时刻及发生置信度确定各破裂先兆事件之间的连接关系，并以此确定可控核聚变实验对应的破裂事件链，从而根据破裂事件链确定等离子体破裂的原因。可见，通过上述方案，通过核聚变大模型和多模态判别器充分利用可控核聚变多模态、碎片化的实验数据和专家经验，实现对等离子体破裂原因的分析，进而基于等离子体破裂的原因确定下一次实验的控制决策，从而提升可控核聚变实验的迭代效率。

17.

发明授权
面向对象设计原则自动检测方法和装置有权

公开(公告)号：CN117555590B

公开(公告)日：2024-05-14

申请号：CN202311421584.5

申请日：2023-10-26

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 李大松 , 周娜 , 唐枫

IPC: G06F8/74 , G06F8/75 , G06F11/36

Abstract: 本申请涉及一种面向对象设计原则自动检测方法和装置。该方法包括：对待检测的面向对象程序源码进行设计原则符合性检测，得到符合性检测评分值；其中，设计原则符合性检测包括迪米特法则符合性检测、依赖倒置原则符合性检测、接口隔离原则符合性检测、合成复用原则符合性检测以及里氏替换原则符合性检测；基于预设的设计原则评分权重和各项符合性检测评分值，得到面向对象程序源码的符合性总评分。采用本方法能够快速准确的对面向对象设计原则符合性进行检测及评价，得出总体评价分数，在软件开发编码阶段即可对软件设计质量有直观参考，明确后续软件质量提升方向，避免软件上线后可能造成的扩展和维护难度高、成本高的问题。

18.

发明公开
一种基于构建出的核聚变知识图谱的任务执行方法及装置审中-实审

公开(公告)号：CN117494800A

公开(公告)日：2024-02-02

申请号：CN202311206289.8

申请日：2023-09-18

Applicant: 之江实验室 , 核工业西南物理研究院

Inventor： 王志华 , 龙沁沁 , 王海平 , 高枫 , 杨宗谕 , 陈卓 , 陈云川 , 汪涛 , 魏一雄

IPC: G06N5/022

Abstract: 本说明书公开了一种基于构建出的核聚变知识图谱的任务执行方法及装置，通过语料获取到实体名称信息之后，即可根据以核聚变领域内语料训练过的目标模型对实体名称信息间的相关性信息进行判断，无需人工进行对其的判断过程。并且在获取相关性信息之后，可进一步构建出核聚变知识图谱，通过核聚变知识图谱对实验任务进行任务分析，大量减少任务分析所需的时间，提高任务执行效率。

19.

发明公开
模型训练的方法、图像识别的方法、装置及电子设备审中-实审

公开(公告)号：CN118644697A

公开(公告)日：2024-09-13

申请号：CN202410563863.3

申请日：2024-05-08

Applicant: 之江实验室

Inventor： 陈云川 , 宋子豪 , 倪书磊 , 邱逸盛 , 王原原 , 杨清霖 , 陈华曦 , 魏一雄

IPC: G06V10/764 , G06V10/774 , G06V10/42

Abstract: 本说明书提供了模型训练的方法、图像识别的方法、装置及电子设备，通过将获取到的样本图像输入到图像识别模型中，可以通过图像识别模型，随机生成针对特征提取层的各特征提取窗口，以通过各特征提取窗口，对样本图像进行特征提取，并将每个特征提取窗口提取出的子特征图按照不重叠的方式进行组合，得到与样本图像尺寸相同的特征图，将该特征图输入到图像识别模型中的识别层中，得到识别结果，并以最小化该识别结果与样本图像对应的标签结果之间的偏差为优化目标，对图像识别模型进行训练。

20.

发明公开
一种基于公式学习的大模型微调方法、装置及存储介质有权

公开(公告)号：CN118378592A

公开(公告)日：2024-07-23

申请号：CN202410803845.8

申请日：2024-06-20

Applicant: 之江实验室

Inventor： 王海平 , 高枫 , 邹常青 , 龙沁沁 , 王军 , 魏一雄

IPC: G06F40/117 , G06N5/04 , G06F40/151

Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质，获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式，根据该公式的上下文内容，确定目标文本并确定目标文本中的候选变量，在该公式中确定与候选变量一致的匹配变量，根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽，得到任务文本，根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本，根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量，对大模型进行微调，使大模型学习到公式中的变量与其解释之间的对应关系，从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification