Patent search ap:("南京大学") AND inv:"杨希" Page 1

1.

发明公开
一种基于均衡求解的大模型对齐方法审中-实审

公开(公告)号：CN119539058A

公开(公告)日：2025-02-28

申请号：CN202411689955.2

申请日：2024-11-25

Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学

Inventor： 孟林建 , 霍静 , 高阳 , 孟繁宇 , 杨希

IPC: G06N5/022 , G06N5/04

Abstract: 本发明提供一种基于均衡求解的大模型对齐方法，涉及数据处理技术领域，该方法包括：获取问题数据集和预测模型，所述问题数据集包括多个问题，所述预测模型用于在不同场景下判断回应的回应效果；基于预设语言模型对所述多个问题中每个问题进行回应，得到所述每个问题对应的两个回应文本；基于所述预测模型将所述每个问题对应的两个回应文本划分为第一文本和第二文本，所述第一文本的回应效果好于所述第二文本的回应效果；基于所述每个问题对应的第一文本和第二文本构建训练数据集；基于所述训练数据集对所述预设语言模型进行训练，得到目标模型，所述目标模型用于对问题进行回应。本发明能提高语言模型输出的回应效果。

2.

发明公开
一种基于动态约束强化学习的大模型安全对齐方法审中-实审

公开(公告)号：CN119539057A

公开(公告)日：2025-02-28

申请号：CN202411688975.8

申请日：2024-11-25

Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学

Inventor： 孟繁宇 , 白志欣 , 王砚铭 , 霍静 , 王博岩 , 杨希 , 高阳

IPC: G06N5/022 , G06N5/04 , G06N20/00 , G06N3/048 , G06N3/092 , G06N3/084 , G06N3/0455

Abstract: 本申请提供一种基于动态约束强化学习的大模型安全对齐方法，所述方法包括：构建对话偏好数据集；基于所述对话偏好数据集分别对初始奖励模型和初始成本模型进行训练，得到训练好的奖励模型和训练好的成本模型；基于所述训练好的奖励模型和所述训练好的成本模型生成第一微调策略和第二微调策略；根据所述第一微调策略和/或第二微调策略对所述初始大语言模型进行更新，得到更新后的大语言模型。本申请通过构建好的对话偏好数据集分别对奖励模型和成本模型进行训练，通过训练好的奖励模型和成本模型生成第一微调策略和第二微调策略，从而对大语言模型进行更新，提高了大语言模型在安全性和有用性之间的平衡性。

3.

发明公开
一种基于多智能体和大语言模型的自进化医疗会诊系统审中-实审

公开(公告)号：CN119560134A

公开(公告)日：2025-03-04

申请号：CN202411691097.5

申请日：2024-11-25

Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学

Inventor： 陈开 , 霍静 , 孟繁宇 , 杨希 , 高阳

IPC: G16H50/20 , G16H10/60

Abstract: 本申请提供一种基于多智能体和大语言模型的自进化医疗会诊系统，包括：获取模块，用于从共享对话样本池中获取目标信息集，所述目标信息集中包括M个样本信息组合，所述样本信息组合包括N轮问诊信息，每个样本信息组合包括的N轮问诊信息均为同一个智能体与目标患者的问诊信息，且不同样本信息组合对应的智能体不同，M和N均为大于1的整数；输出模块，用于根据所述目标信息集输出所述目标患者的诊断信息。这样，提升了目标患者的诊断信息输出效率和输出结果的准确度。

4.

发明公开
香草醇氧化酶突变体及其制备方法和应用审中-实审

公开(公告)号：CN119709671A

公开(公告)日：2025-03-28

申请号：CN202411935983.8

申请日：2024-12-26

Applicant: 南京大学

Inventor： 任鑫坤 , 潘文进 , 董佳敏 , 曹家南 , 杨希 , 张佳琪 , 蒙玉培

IPC: C12N9/04 , C12P7/22 , C12N15/70 , C12N15/53 , C12N1/21 , C12R1/19

Abstract: 本发明公开了香草醇氧化酶突变体及其制备方法和应用，野生型香草醇氧化酶来自简青霉Penicillium simplicissimum，使用定向进化的手段对其活性中心进行改造，得到了具有较高活性、顺反选择性和顺式异丁香酚产率的香草醇氧化酶突变体，所述突变为S106L、L316F或I468L中的至少一种。本发明实现了由廉价4‑丙基愈创木酚向顺式异丁香酚的高效合成，有利于顺式异丁香酚的工业化合成与应用。

Patent Agency Ranking