Patent search ap:("之江实验室") AND inv:"周子豪" Page 1

1.

发明授权
面向核聚变数据标准化的数据仓库系统及数据处理系统有权

公开(公告)号：CN117743476B

公开(公告)日：2024-11-26

申请号：CN202311554759.X

申请日：2023-11-21

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 程达 , 陈卓 , 王硕 , 李大松 , 周娜 , 唐枫 , 包青平

IPC: G06F16/28 , G06F16/21 , G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25

Abstract: 本发明公开了一种面向核聚变数据标准化的数据仓库架构及数据处理系统，包括：操作型数据层，用于提取并转存核聚变业务数据，核聚变业务数据包括：核聚变数据业务操作数据、核聚变物理/业务实体数据、聚变实验数据；数据标准层，用于通过数据工具集对核聚变业务数据进行清洗、标准化；语义标准层，用于基于核聚变业务数据获取事实表、数据维表；根据核聚变数据业务建立雪花模型维护事实表与数据维表；并将聚变实验数据与事实表、数据维表建立关系，得到数据宽表；分析标准层，用于对语义标准层提供的数据宽表进行主题分类，得到每个主题下的数据宽表；数据应用层，用于将每个主题下的数据宽表面向目标维度进行聚合或数据转换。

2.

发明公开
面向对象设计原则自动检测方法和装置审中-实审

公开(公告)号：CN117555590A

公开(公告)日：2024-02-13

申请号：CN202311421584.5

申请日：2023-10-26

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 李大松 , 周娜 , 唐枫

IPC: G06F8/74 , G06F8/75 , G06F11/36

Abstract: 本申请涉及一种面向对象设计原则自动检测方法和装置。该方法包括：对待检测的面向对象程序源码进行设计原则符合性检测，得到符合性检测评分值；其中，设计原则符合性检测包括迪米特法则符合性检测、依赖倒置原则符合性检测、接口隔离原则符合性检测、合成复用原则符合性检测以及里氏替换原则符合性检测；基于预设的设计原则评分权重和各项符合性检测评分值，得到面向对象程序源码的符合性总评分。采用本方法能够快速准确的对面向对象设计原则符合性进行检测及评价，得出总体评价分数，在软件开发编码阶段即可对软件设计质量有直观参考，明确后续软件质量提升方向，避免软件上线后可能造成的扩展和维护难度高、成本高的问题。

3.

发明公开
网页数据采集方法、系统、计算机设备和可读存储介质有权

公开(公告)号：CN118839053A

公开(公告)日：2024-10-25

申请号：CN202411321148.5

申请日：2024-09-23

Applicant: 之江实验室

Inventor： 周子豪 , 王海平 , 程达 , 刘朝阳 , 魏一雄 , 邹常青 , 胡斌 , 杨仁杰

IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186

Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练，所述方法包括：确定目标场景模板和目标关键词；将所述目标关键词填充到所述目标场景模板中，调用通用的大语言模型，生成多个搜索词句；调用搜索服务，基于所述搜索词句生成第一URL列表；基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。

4.

发明授权
面向对象设计原则自动检测方法和装置有权

公开(公告)号：CN117555590B

公开(公告)日：2024-05-14

申请号：CN202311421584.5

申请日：2023-10-26

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 李大松 , 周娜 , 唐枫

IPC: G06F8/74 , G06F8/75 , G06F11/36

Abstract: 本申请涉及一种面向对象设计原则自动检测方法和装置。该方法包括：对待检测的面向对象程序源码进行设计原则符合性检测，得到符合性检测评分值；其中，设计原则符合性检测包括迪米特法则符合性检测、依赖倒置原则符合性检测、接口隔离原则符合性检测、合成复用原则符合性检测以及里氏替换原则符合性检测；基于预设的设计原则评分权重和各项符合性检测评分值，得到面向对象程序源码的符合性总评分。采用本方法能够快速准确的对面向对象设计原则符合性进行检测及评价，得出总体评价分数，在软件开发编码阶段即可对软件设计质量有直观参考，明确后续软件质量提升方向，避免软件上线后可能造成的扩展和维护难度高、成本高的问题。

5.

发明公开
一种大语言模型交互方法和装置无效

公开(公告)号：CN117236416A

公开(公告)日：2023-12-15

申请号：CN202311498497.X

申请日：2023-11-13

Applicant: 之江实验室

Inventor： 胡斌 , 赵晨阳 , 张璞 , 周子豪 , 刘斌

IPC: G06N3/092 , G06N3/045

Abstract: 本发明公开了一种大语言模型交互方法和装置，该方法提出一种新的规划者‑协调者‑执行者的大语言模型交互框架，其中，大语言模型作为规划者，智能体作为执行者，新增的协调者可以确定何时请求与规划者通信，并将执行者当前的观测数据转化成规划者可以理解的自然语言形式的文本字符串，协调者可通过基于无效通信惩罚的强化学习预训练，实施最优通信策略。本发明通过实施最优通信策略可以在正式部署到测试环境后显著减少与规划者的通信次数，同时协调者能够在规划者容易出错的场景下减少对规划者的依赖，以及在面对突发情况时及时求助于规划者，提高了执行者的安全性与任务成功率。

6.

发明公开
面向核聚变数据标准化的数据仓库架构及数据处理系统有权

公开(公告)号：CN117743476A

公开(公告)日：2024-03-22

申请号：CN202311554759.X

申请日：2023-11-21

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 程达 , 陈卓 , 王硕 , 李大松 , 周娜 , 唐枫 , 包青平

IPC: G06F16/28 , G06F16/21 , G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25

Abstract: 本发明公开了一种面向核聚变数据标准化的数据仓库架构及数据处理系统，包括：操作型数据层，用于提取并转存核聚变业务数据，核聚变业务数据包括：核聚变数据业务操作数据、核聚变物理/业务实体数据、聚变实验数据；数据标准层，用于通过数据工具集对核聚变业务数据进行清洗、标准化；语义标准层，用于基于核聚变业务数据获取事实表、数据维表；根据核聚变数据业务建立雪花模型维护事实表与数据维表；并将聚变实验数据与事实表、数据维表建立关系，得到数据宽表；分析标准层，用于对语义标准层提供的数据宽表进行主题分类，得到每个主题下的数据宽表；数据应用层，用于将每个主题下的数据宽表面向目标维度进行聚合或数据转换。

7.

发明公开
针对大科学装置的科学实验数据管理方法、装置和系统审中-实审

公开(公告)号：CN117555867A

公开(公告)日：2024-02-13

申请号：CN202311408184.0

申请日：2023-10-26

Applicant: 之江实验室

Inventor： 周子豪 , 魏一雄 , 高超霖 , 丁洁瑶 , 李大松 , 程达 , 王硕 , 周娜 , 唐枫 , 陈卓

IPC: G06F16/172 , G06F18/22 , G06F16/23 , G06F16/16 , G06F16/178

Abstract: 本申请涉及一种针对大科学装置的科学实验数据管理方法、装置和系统。所述方法包括：获取待存储目标数据；基于预设的数据类型将待存储目标数据进行分割，得到与科学实验一一对应的至少一种待存储实验数据，并将所有待存储实验数据存储至预设的私有存储系统中；获取对应于待存储目标数据的存储指令，基于存储指令从待存储实验数据中确定公有文件，并将公有文件基于私有存储系统上传到预设的公有存储系统中，得到对应于待存储目标数据的存储结果。采用本方法能够提高科学装置相关的数据存储效率，并提高针对实验数据的管理效率。

8.

发明授权
网页数据采集方法、系统、计算机设备和可读存储介质有权

公开(公告)号：CN118839053B

公开(公告)日：2025-02-11

申请号：CN202411321148.5

申请日：2024-09-23

Applicant: 之江实验室

Inventor： 周子豪 , 王海平 , 程达 , 刘朝阳 , 魏一雄 , 邹常青 , 胡斌 , 杨仁杰

IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186

Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练，所述方法包括：确定目标场景模板和目标关键词；将所述目标关键词填充到所述目标场景模板中，调用通用的大语言模型，生成多个搜索词句；调用搜索服务，基于所述搜索词句生成第一URL列表；基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。

9.

发明公开
基于异构数据库和大语言模型的训练数据管理系统及方法审中-实审

公开(公告)号：CN119357275A

公开(公告)日：2025-01-24

申请号：CN202411920576.X

申请日：2024-12-25

Applicant: 之江实验室

Inventor： 周子豪 , 邓祎 , 程达 , 王海平 , 胡斌 , 刘朝阳 , 魏一雄 , 潘宇

IPC: G06F16/25 , G06F16/28 , G06N5/04 , G06N3/0455 , G06N3/08

Abstract: 基于异构数据库和大语言模型的训练数据管理系统及方法，系统包括：异构数据库系统模块，包括多个支持不同数据类型的数据库；数据管理注册中心模块，用于管理所述多个数据库及所注册的数据服务的节点信息；前置大语言模型模块，用于解析客户端发送的自然语言指令，对应生成用于描述所述数据服务的标准执行语句；数据服务控制器模块，用于解析所述标准执行语句并转换为目标执行语句，基于所述目标执行语句从所述数据管理注册中心模块中对应的节点信息调用对应的数据服务，以在对应的数据库上执行对应的操作。本申请可提升查询并收集特定训练数据等数据服务的效率，并大大降低数据管理的复杂性。

10.

发明授权
一种提取大语言模型微调数据的方法、系统和计算机设备有权

公开(公告)号：CN118798189B

公开(公告)日：2024-12-17

申请号：CN202411260476.9

申请日：2024-09-10

Applicant: 之江实验室

Inventor： 周子豪 , 王海平 , 胡斌 , 邓祎 , 魏一雄 , 邹常青 , 刘朝阳 , 程达

IPC: G06F40/284

Abstract: 本申请涉及一种提取大语言模型微调数据的方法、系统和计算机设备。包括：获取原始文本数据，构建语料库；语料库包括多条文本语料，文本语料以原始文本数据的最小标题作为语料输入、以最小标题对应的正文数据作为语料输出；基于语料库对各文本语料的语料输入进行非停用词划分，并计算各非停用词的逆文本频率指数；获取语料库的最小逆文本频率指数均值；基于逆文本频率指数计算每条文本语料的逆文本频率指数均值；将逆文本频率指数均值与最小逆文本频率指数均值进行比较得到比较结果，从而确定该文本语料是否为大语言模型的微调数据。采用本方法实现了高质量的大语言模型微调数据的提取，提高了微调数据的提取效率，降低了微调数据集的构建成本。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification