Patent search ap:("中国科学院自动化研究所") AND inv:"胡庆浩" Page 4

31.

发明授权
一种离线强化学习和持续在线微调的决策方法和模型有权

公开(公告)号：CN119249360B

公开(公告)日：2025-05-20

申请号：CN202411767208.6

申请日：2024-12-04

Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所

Inventor： 胡庆浩 , 丁嘉慕 , 王培松 , 李成华 , 程健

IPC: G06F18/25 , G06F18/22 , G06F18/213 , G06F18/21 , G06N3/045 , G06N3/096 , G06N3/092

Abstract: 本发明公开了一种离线强化学习和持续在线微调的决策方法和模型，该方法包括获取原始文本‑图像对数据和历史轨迹数据，通过特征匹配验证和标准化处理得到增强状态序列；利用多层级注意力机制进行序列预测，并通过知识蒸馏和任务适应性增强得到预训练模型参数；基于稳定性评估和可塑性控制对模型进行在线知识迁移，结合经验回放优化得到优化后模型参数；最后进行多维度性能评估和资源优化。本发明通过多模态特征融合、动态知识迁移和自适应优化机制，有效解决了特征表示不充分、灾难性遗忘和优化效率低等问题，提高了模型的学习效率和泛化能力。

32.

发明公开
多模态大模型驱动的智能体收集决策数据的方法及系统有权

公开(公告)号：CN119808006A

公开(公告)日：2025-04-11

申请号：CN202510287600.9

申请日：2025-03-12

Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所

Inventor： 李成华 , 杨波 , 胡庆浩 , 王培松 , 张一帆

IPC: G06F18/25 , G08G1/01 , G06N7/01 , G06N3/045 , G06N5/04

Abstract: 本发明公开了一种多模态大模型驱动的智能体收集决策数据的方法及系统，该方法包括采集预定传感器原始数据，计算信息熵与归一化质量分数，经自适应多模态信息融合生成融合特征向量；对其做时序敏感多模态对齐处理，结合时间戳嵌入与自注意力机制得时序对齐特征；基于此用贝叶斯神经网络生成决策分布，评估不确定性并生成最终决策及指标集；结合任务描述评估任务得分，根据资源状态制定执行计划；初始化模型，生成合成数据，优化模型并存储经验。本发明实现了智能小车的高效决策过程，同时提升了智能小车的执行能力和任务完成精度。

33.

发明公开
面向决策大模型的多级异构内存协同调度方法审中-实审

公开(公告)号：CN119576555A

公开(公告)日：2025-03-07

申请号：CN202411655388.9

申请日：2024-11-19

Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所

Inventor： 胡庆浩 , 王培松 , 李成华 , 程健

IPC: G06F9/50 , G06N5/04 , G06N3/045 , G06N3/08 , G06N3/063

Abstract: 本发明提供一种面向决策大模型的多级异构内存协同调度方法，包括获取异构内存系统的硬件配置信息和初始状态信息，基于爱尔朗分布族构建突发访存模型，结合自适应分层采样获取动态访存特征；采用多维效能度量和层级亲和度矩阵表征内存系统状态；接着基于广义极值理论预测负载特征，构建增广拉格朗日优化模型生成资源分配方案；通过帕累托优化算法制定数据迁移策略；引入汤普森采样的动态参数调整和基于组合预警指标的异常处理机制。本发明能够精确刻画访存特征、优化资源分配、降低迁移开销，提升决策大模型训练效率。

34.

发明授权
基于卷积的大模型微调加速方法及装置有权

公开(公告)号：CN119006959B

公开(公告)日：2025-01-21

申请号：CN202411455251.9

申请日：2024-10-17

Applicant: 中国科学院自动化研究所

Inventor： 胡庆浩 , 程健

IPC: G06V10/774 , G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/82

Abstract: 本公开涉及人工智能领域，提供一种基于卷积的大模型微调加速方法及装置，所述方法包括：获取经过预训练的大模型和微调训练数据；在所述大模型的自注意力模块中引入卷积模块，得到初始微调模型；在固定所述大模型的参数的条件下，利用所述微调训练数据，对所述初始微调模型进行训练，得到微调训练模型；基于所述微调训练模型，得到经过微调的大模型。本公开可以解决对大模型进行微调训练可能会遇到训练内存占用高、训练速度慢、预训练知识遗忘的问题，实现模型对微调训练数据的加速学习，优化模型在微调训练数据所属的任务或领域中的表现。

35.

发明授权
面向轻量卷积神经网络的训练后量化方法、装置有权

公开(公告)号：CN118643878B

公开(公告)日：2024-11-15

申请号：CN202411097720.4

申请日：2024-08-12

Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所

Inventor： 胡庆浩 , 王培松 , 宋晓勇 , 程健

IPC: G06N3/0495 , G06N3/0464 , G06N3/084

Abstract: 本发明公开了一种面向轻量卷积神经网络的训练后量化方法、装置，该方法包括读取图像数据；构建浮点模型和量化后模型，基于随机预处理和打乱顺序后的图像批次，逐块地对浮点模型和量化后模型中的每个模型块进行输出特征图的重建，并计算输出特征图重建的损失；基于特征图重建的损失，对量化后模型的每个模型块的批归一化参数和量化参数进行梯度更新和学习。本发明通过对图像数据进行逐块地预处理和随机打乱顺序，提高了模型对输入数据的泛化能力，避免了模型过拟合；通过逐块学习并更新批归一化层参数、权重缩放因子和激活缩放因子，可以在量化过程中细致调整模型参数，在低比特量化下仍保持较高的模型精度。

36.

发明公开
面向轻量卷积神经网络的训练后量化方法、装置有权

公开(公告)号：CN118643878A

公开(公告)日：2024-09-13

申请号：CN202411097720.4

申请日：2024-08-12

Applicant: 中科南京人工智能创新研究院 , 中国科学院自动化研究所

Inventor： 胡庆浩 , 王培松 , 宋晓勇 , 程健

IPC: G06N3/0495 , G06N3/0464 , G06N3/084

Abstract: 本发明公开了一种面向轻量卷积神经网络的训练后量化方法、装置，该方法包括读取图像数据；构建浮点模型和量化后模型，基于随机预处理和打乱顺序后的图像批次，逐块地对浮点模型和量化后模型中的每个模型块进行输出特征图的重建，并计算输出特征图重建的损失；基于特征图重建的损失，对量化后模型的每个模型块的批归一化参数和量化参数进行梯度更新和学习。本发明通过对图像数据进行逐块地预处理和随机打乱顺序，提高了模型对输入数据的泛化能力，避免了模型过拟合；通过逐块学习并更新批归一化层参数、权重缩放因子和激活缩放因子，可以在量化过程中细致调整模型参数，在低比特量化下仍保持较高的模型精度。

37.

发明公开
输变电缺陷识别的方法、装置、计算机设备和存储介质有权

公开(公告)号：CN116912637A

公开(公告)日：2023-10-20

申请号：CN202311174427.9

申请日：2023-09-13

Applicant: 国网山东省电力公司济南供电公司 , 中国科学院自动化研究所

Inventor： 胥明凯 , 任志刚 , 杨杰 , 于光远 , 韩显芳 , 李琮 , 瞿寒冰 , 刘晓 , 刘一男 , 胡庆浩 , 陈显达 , 王淑颖 , 王思源 , 刘昭 , 张雨薇

IPC: G06V10/774 , G06V10/77 , G06V10/25 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0895 , G06N3/082 , G06T7/00

Abstract: 本发明公开了一种输变电缺陷识别的方法、装置、计算机设备和存储介质，属于图像处理技术领域，应用于变电站场景的方法包括：获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集；利用训练集训练卷积神经网络，建立基于YoloV3模型的变电站缺陷识别模型；基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型：利用验证集对轻量化变电站缺陷识别模型进行验证；实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测。本发明能够及时发现和鉴别变电站和输电线路缺陷，提高了变电站和输电线路运维自动化水平和电网运行安全，也适用于输电线路场景。

38.

发明授权
可调节量化位宽的神经网络量化与压缩的方法及装置有权

公开(公告)号：CN107480770B

公开(公告)日：2020-07-28

申请号：CN201710624244.0

申请日：2017-07-27

Applicant: 中国科学院自动化研究所

Inventor： 程健 , 贺翔宇 , 胡庆浩

IPC: G06N3/04 , G06N3/08

Abstract: 本发明涉及神经网络技术领域，具体提出一种卷积神经网络量化与压缩的方法及装置。旨在解决现有对神经网络量化与压缩的方法对网络性能造成较大损失的问题。本发明的方法包括获取原始卷积神经网络的权值张量和输入特征张量，并基于预先设定的量化位宽，对权值张量和输入特征张量进行定点量化，并将得到的权值定点表示张量以及输入特征定点表示张量替换原来的权值张量和输入特征张量，得到对原始卷积神经网络量化与压缩后的新的卷积神经网络。本发明能够根据不同的任务需要灵活地调整位宽，无需调整算法结构和网络结构即可实现对卷积神经网络的量化与压缩，减少对内存以及存储资源的占用。本发明还提出一种存储装置和处理装置，具有上述有益效果。

39.

发明公开
基于离散时间观测状态的离散反馈控制器设计方法、设备及存储介质无效

公开(公告)号：CN110703600A

公开(公告)日：2020-01-17

申请号：CN201910890294.2

申请日：2019-09-20

Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院 , 南京信息工程大学

Inventor： 郑哲 , 胡庆浩 , 程健 , 刘青山

IPC: G05B13/04

Abstract: 本发明提供了一种基于离散时间观测状态的离散反馈控制器设计方法、设备及存储介质，所述离散时间观测状态的离散反馈控制器设计方法包括：基于离散时间观测状态的反馈控制讨论了具有饱和执行器与混杂随机非线性系统的镇定问题；通过设计基于离散时间观测状态的反馈控制器使得相应的闭环系统均方指数稳定；通过给出的充分条件求出最大允许观测状态时间间隔，仿真实例虽然证明该方法的有效性。

40.

发明公开
一种基于快速GAN的图像生成方法无效

公开(公告)号：CN110662069A

公开(公告)日：2020-01-07

申请号：CN201910890284.9

申请日：2019-09-20

Applicant: 中国科学院自动化研究所南京人工智能芯片创新研究院 , 南京信息工程大学

Inventor： 郑哲 , 胡庆浩 , 冷聪 , 刘青山

IPC: H04N19/42 , H04N19/124 , H04N19/182 , G06N3/02

Abstract: 本发明提供一种基于快速GAN的图像生成方法，对生成对抗网络采用量化压缩技术，加快图像生成的速度,达到实时的效果。所述方法包括：对GAN网络进行压缩，在资源受限的前提下最小程度的降低生成图片的质量。选取最易实时的网络压缩技术：量化；由于图像生成对处理速度要求较高，所以需要选取处理速度达到实时的网络压缩算法，目前有剪枝、量化、轻量级网络结构设计等。本发明采用低比特量化技术，为了减少性能的降低保持判别网络为浮点型，只量化生成网络。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification