一种迭代的神经网络批量规范化系统

    公开(公告)号:CN111027568A

    公开(公告)日:2020-04-17

    申请号:CN201911047484.4

    申请日:2019-10-30

    Inventor: 辛淼 程健

    Abstract: 本发明公开了一种迭代的神经网络批量规范化系统,包括特征预处理单元、神经网络构建单元和网络批量规范单元;所述特征预处理单元可以对需要进行识别的图片进行特征预处理,去除背景中干扰信息;所述神经网络构建单元可以训练出识别图像内容的学习网络,进一步处理图片;所述网络批量规范单元可以对神经网络的训练模式进行改进,提高训练过程中的收敛速度。本发明通过批量规范了神经网络的训练过程,减少了神经网络构建的代价,提高了神经网络的训练速度。

    一种基于深度学习的肢体语言检测与行为分析方法及系统

    公开(公告)号:CN110929762A

    公开(公告)日:2020-03-27

    申请号:CN201911048238.0

    申请日:2019-10-30

    Inventor: 唐云飞 辛淼 程健

    Abstract: 本发明提出了一种基于深度学习的肢体语言检测与行为分析方法及系统。通过对目标的行为视频、图片以及语音进行提取,分别获取目标在不同情绪下的面部表情以及四肢行为的图片及视频,获取在相应情绪下的语音数据,丰富数据集,予以标注后制作成训练集。后使用CNN训练图片及视频帧数据,关键点为面部表情,头部动作,四肢动作,整体动作频率,这4点训练成一个集成模型,其次使用LSTM训练语音数据,最后将两个模型进行集成训练,合成集成模型,最终会产生3个模型,保证模型支持语音或图片单独检测的能力。上述过程使得本发明拥有较强的主动学习能力,并不断优化数据库,使得准确率能够随着识别次数的增加不断提升。

    一种视觉语言大模型混合量化方法、装置和电子设备

    公开(公告)号:CN119441513A

    公开(公告)日:2025-02-14

    申请号:CN202510033310.1

    申请日:2025-01-09

    Abstract: 本发明涉及混合量化技术领域,具体涉及一种视觉语言大模型混合量化方法、装置和电子设备,该方法包括:将构建的图像编码器校准集输入预先建立的图像编码器和文本编码器,并从预先定义的混合精度量化的搜索空间中选择量化方案对图像编码器进行训练后量化,基于量化前后图像编码器和文本编码器的输出计算第一量化误差;将多模态校准集输入视觉语言大模型,并从搜索空间中选择量化方案对视觉语言大模型进行混合精度量化,根据量化前后视觉语言大模型的输出计算第二量化误差;将各量化方案及对应的量化误差存入到哈希表中;结合哈希表使用基于策略梯度的强化学习算法来优化生成量化方案的策略。通过哈希表加速量化方案的搜索过程,提高优化效率。

    基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品

    公开(公告)号:CN118886453A

    公开(公告)日:2024-11-01

    申请号:CN202411376160.6

    申请日:2024-09-29

    Abstract: 本公开涉及一种基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品,所述基于低秩量化大模型的预测方法包括:获取预测模型,其中,预测模型为大模型;通过将预测模型中的线性层的参数进行低秩分解,得到第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵;基于第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵,构建与线性层对应的量化低秩模块,其中,量化低秩模块依次包含第一激活量化层、第一线性层、尺度缩放层、第二激活量化层、和第二线性层;通过将预测模型中的线性层替换为量化低秩模块,得到压缩后的预测模型;将输入数据输入到压缩后的预测模型,得到与输入数据对应的预测结果。能够解决模型预测推理速度低下的问题。

    基于视觉预训练模型的模仿学习混合样本处理方法及装置

    公开(公告)号:CN117975190A

    公开(公告)日:2024-05-03

    申请号:CN202311868899.4

    申请日:2023-12-29

    Inventor: 关伟凡 张希 程健

    Abstract: 本发明提供一种基于视觉预训练模型的模仿学习混合样本处理方法及装置,该方法包括:获取专家样本集;向次优专家样本添加目标噪声得到噪声专家样本,根据噪声专家样本和最优专家样本得到混合样本集;标定混合样本集的权重系数,对重分布的混合样本集进行预测和评分,再根据评分结果训练策略网络和奖励函数网络,根据目标奖励函数网络对评估数据集的各样本进行评分,得到评估数据集对应的预测排序,以更新重分布的混合样本集中各样本对应的权重系数,最后根据目标策略网络对重分布后的权重系数进行模仿学习,得到优化后的专家样本。本发明所述方法针对品质不一的混合专家样本进行差异化学习,改善数据集样本分布,提升模仿学习智能体的泛化能力。

    数据处理方法、神经网络的训练方法及相关装置、设备

    公开(公告)号:CN113326930B

    公开(公告)日:2024-05-03

    申请号:CN202010134455.8

    申请日:2020-02-29

    Abstract: 本申请提供了一种数据处理方法、神经网络的训练方法及相关装置、设备,方法应用于训练设备,方法包括:将神经网络的模型参数设置为浮点数进行训练,直到训练设备训练第一神经网络达到收敛状态;确定训练后的第一神经网络中第l个卷积层包含的各个卷积核之间的相关度;其中,卷积核对应的相关度越大,训练设备在进行计算时产生的冗余计算越多;将M个卷积核进行量化训练,直至训练设备训练第一神经网络达到收敛状态,得到量化后的第二神经网络;其中,其中,M为大于0的正整数;M个卷积核为相关度较高的前M个卷积核。实施本申请,可以在提高神经网络的运算效率的同时,尽可能地保持神经网络的运算精度。

    一种高效运动互补神经网络系统

    公开(公告)号:CN111104553B

    公开(公告)日:2023-12-12

    申请号:CN202010012178.3

    申请日:2020-01-07

    Inventor: 张一帆 程科 程健

    Abstract: 本发明公开了一种高效运动互补神经网络系统,包括视频读取单元、视频类别单元和神经网络补充单元;所述视频读取单元对输入的视频进行读取,同时对视频的描述信息等文字辅助信息进行提取;所述视频类别单元根据网络等视频提取源对视频的描述信息对视频的类别进行初步判定,并将视频划分到神经网络中已有的类别分区中;所述神经网络补充单元分成两个模块,对视频分类的方法进行优化,缩短视频分类的时间。本发明针对双流法和3D卷积法分别做出提高计算光流效率和缩小网络计算量的优化方法,提升了视频提取和分类的速度。

Patent Agency Ranking