基于自动梯度混合的神经网络模型知识蒸馏方法及系统

    公开(公告)号:CN115019085B

    公开(公告)日:2025-04-08

    申请号:CN202210544252.5

    申请日:2022-05-18

    Abstract: 本发明提出一种基于自动梯度混合的神经网络模型知识蒸馏方法和系统,包括通过损失函数,将教师网络的知识蒸馏至学生网络,得到任务损失和蒸馏损失;对该任务损失和该蒸馏损失进行反向传播,得到任务梯度向量和蒸馏梯度向量,以及任务梯度向量和蒸馏梯度向量间的夹角;以任务梯度向量约束总梯度向量,选择效果最优的候选偏转系数作为最终偏转系数以计算权重系数,将该权重系数加到损失函数,得到最终损失函数,并以该最终损失函数将该教师网络的知识蒸馏至该学生网络。由此本发明可自动调节权重系数超参。

    一种多任务强化学习方法及系统
    22.
    发明公开

    公开(公告)号:CN117829250A

    公开(公告)日:2024-04-05

    申请号:CN202311695347.8

    申请日:2023-12-11

    Abstract: 本发明提出一种多任务强化学习方法,包括:以混合专家模型构建强化学习模型,将该强化学习模型根据功能划分为多个模块,并对该模块进行对比学习训练;其中,以该混合专家模型部分为该强化学习模型的共享模块;对某一任务的每一步执行过程中,基于该任务的时序信息和任务信息,选取该模块构成模块组合,以该模块组合执行当前步的任务。本发明还提出一种多任务强化学习系统,以及一种用于实现多任务强化学习的数据处理装置。

    一种捕捉环境中可控因素的表示学习方法及系统

    公开(公告)号:CN117688983A

    公开(公告)日:2024-03-12

    申请号:CN202211014964.2

    申请日:2022-08-23

    Abstract: 本发明提出一种捕捉环境中可控因素的表示学习方法和系统,包括:智能体采集在当前所处环境的观测图像,通过卷积神经网络对该观测图像进行编码,得到当前时刻t该观测图像的表示;统计该当前时刻t该观测图像的表示、t时刻到t+k‑1时刻策略所采取的动作序列和第t+k时刻该观测图像的表示,三者之间的互信息作为可控因素的度量;基于该度量构建损失函数,以最大化该度量,基于该度量最大时对应的时刻t该观测图像的表示,执行学习策略,得到目标动作,该智能体执行该目标动作与该环境产生交互。本发明通过捕捉环境中的可控因素,能有效过滤其他可预测的噪声,因此在复杂环境上具备更好的鲁棒性。

    基于真值表的函数自动生成方法及系统

    公开(公告)号:CN115329949A

    公开(公告)日:2022-11-11

    申请号:CN202211006130.7

    申请日:2022-08-22

    Abstract: 本发明提出一种基于真值表的函数自动生成方法和系统,包括:基于真值表的问题中逻辑表达式各语法符号的关系与它们的在实际处理的序列中距离大小无关、逻辑表达式的生成语义规则与布尔向量函数示例采样的结果长度无关的科学规律,作为解决基于真值表函数自动化生成问题的科学依据。还设计了一种编码器‑解码器结构的神经网络模型用于解决基于真值表生成函数的问题,该模型用两个自注意力机制编码器分别对输入和输出进行编码,用1个自注意力机制解码器自回归地输出对应的逻辑表达式,在编码器和解码器之间使用注意力机制;为解决基于真值表函数自动化生成问题提供了技术方案,相比同期主流基准模型在指定数据集上取得了更好的效果。

    基于迁移学习的人物检测方法和系统

    公开(公告)号:CN114419667A

    公开(公告)日:2022-04-29

    申请号:CN202111616327.8

    申请日:2021-09-18

    Abstract: 本发明提出一种基于迁移学习的人物检测方法和系统,构建用于图像目标检测的教师网络和其对应的学生网络,获取已标注人物类别标签的图片数据集作为训练数据集;分别根据老师网络和学生网络每层目标检测FPN中特征包含的目标对象信息量,得到老师网络每层目标检测FPN的老师特征丰富度得分和学生网络每层目标检测FPN的学生特征丰富度得分;基于该老师特征丰富度得分和该学生特征丰富度得分,得到分类头约束损失;对教师网络的损失、学生网络的损失和该分类头约束损失进行求和,得到蒸馏损失;该蒸馏损失收敛后使用该学生网络对图片中的人物进行检测。

    基于在线域自适应深度学习的图片分类方法及系统

    公开(公告)号:CN113936168A

    公开(公告)日:2022-01-14

    申请号:CN202111088084.5

    申请日:2021-09-16

    Abstract: 本发明提出一种基于在线域自适应深度学习的图片分类方法和系统,包括通过特征提取网络提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;基于源域特征和目标域特征到聚类中心的距离显式表达域内类别条件分布概率;通过最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新特征提取网络与类别聚类中心;通过求解运输问题,得到目标域样本的类别分配,通过最小化类别分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心,将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算图片特征与经过再次更新的类别聚类中心中所有类别中心的概率,取概率最大的类别作为分类结果。

    融合全局信息的场景分割修正方法与系统

    公开(公告)号:CN107564007A

    公开(公告)日:2018-01-09

    申请号:CN201710650525.3

    申请日:2017-08-02

    Inventor: 唐胜 张蕊 李锦涛

    Abstract: 本发明涉及一种场景分割修正方法,通过全局残差修正网络,以完全残差卷积网络作为前端模型,将该前端模型的置信度图和原始图像按通道拼接起来,作为该全局残差修正网络的输入,从而输出全局修正残差,将该全局修正残差与该置信度图相加,得到场景分割的修正结果;使用已知的场景分割数据集对该全局残差修正网络进行训练;使用已知的场景分割数据集对该全局残差修正网络进行训练。同时本发明还提出了将该全局残差修正网络和局部边界修正网络串联起来,形成级联的框架,该级联的框架可以对前端模型的分割结果进行全局修正和局部修正,从而得到更加精确的场景分割结果。

    基于斐波那契编码的存算一体神经网络加速方法及加速器

    公开(公告)号:CN119416845A

    公开(公告)日:2025-02-11

    申请号:CN202411551391.6

    申请日:2024-11-01

    Abstract: 本发明提出一种基于斐波那契编码的存算一体神经网络加速方法和加速器,包括:存算一体神经网络加速器的斐波那契编码器将参与神经网络运算任务的激活值和权重值从二进制编码为斐波那契编码,得到斐波那契激活和斐波那契权重,存算一体神经网络加速器中存算一体单元的DAC将斐波那契激活转化为多个模拟电压,并分别施加到存算一体单元中SRAM阵列每一行的字线上;SRAM阵列的每个单元将输入的模拟电压乘以相应的斐波那契权重,得到中间运算结果,SRAM阵列每一列的加法器对中间运算结果进行重新分配电荷以完成内积的累加操作,并将累加操作结果通过存算一体单元的ADC转换为斐波那契编码的数字格式,作为神经网络运算任务的运算结果。

    一种离线元强化学习的上下文分布偏移缓解方法及系统

    公开(公告)号:CN117725983A

    公开(公告)日:2024-03-19

    申请号:CN202311721370.X

    申请日:2023-12-14

    Abstract: 本发明提出一种离线元强化学习的上下文分布偏移缓解方法,包括:构建离线元强化学习的模型,基于该模型的行为策略采集训练任务的上下文信息,以该训练任务的上下文信息和该训练任务的任务编码,训练该模型的上下文编码器和元策略;其中,训练该上下文编码器时,最大化该任务编码和该训练任务的互信息,并最小化该任务编码和该行为策略的互信息;基于该模型的探索策略,以该上下文编码器和该元策略执行目标任务。本发明还提出一种离线元强化学习的上下文分布偏移缓解系统,以及一种用于实现离线元强化学习的上下文分布偏移缓解的数据处理装置。

Patent Agency Ranking