少样本语义分割方法、装置、存储介质、计算机设备

    公开(公告)号:CN118298181A

    公开(公告)日:2024-07-05

    申请号:CN202410579839.9

    申请日:2024-05-11

    Abstract: 本发明提出一种少样本语义分割的方法、装置、存储介质、计算机设备,该方法通过将该三维点云数据投影到前视视角的二维平面上,转化为二维平面图像;并利用该二维平面图像构建训练集与测试集,利用该第一训练集训练第一深度语义分割模型;将训练后的该第一深度语义分割模型每个权重矩阵添加对应的低秩矩阵,得到第二深度语义分割模型;利用该第二训练集训练该第二深度语义分割模型,该训练后的该第二深度语义分割模型输出该车辆位置信息的三维点云语义分割结果。该方法提高了自动驾驶感知场景中模型的训练精度。

    采用混合精度量化与知识蒸馏的神经网络训练方法及系统

    公开(公告)号:CN113313250B

    公开(公告)日:2023-11-24

    申请号:CN202110521580.9

    申请日:2021-05-13

    Inventor: 陆顺 胡瑜

    Abstract: 本发明提出一种采用混合精度量化与知识蒸馏的神经网络训练方法,包括:获取已知数据构建为数据集;根据该超参数,对神经网络各层的卷积操作设置多个精度量化位宽并构建超网,将该超网的所有子模型划分至第一模型池和第二模型池;从该第一模型池和该第二模型池中取出多个子模型进行训练和验证;将验证精度高于训练阈值的子模型放入该第一模型池,剩余的子模型放入该第二模型池;进行多轮迭代,直到该第一模型池的更新率小于更新阈值;对该第一模型池中的子模型进行蒸馏训练,得到任务模型。本发明还提出一种神经网络训练系统,以及一种数据处理装置。

    一种训练用于语音分组的分组模型的方法和语音降噪方法

    公开(公告)号:CN111462737B

    公开(公告)日:2023-08-08

    申请号:CN202010225558.5

    申请日:2020-03-26

    Abstract: 本发明实施例提供了一种训练用于语音分组的分组模型的方法和语音降噪方法,该语音降噪方法包括:B1、获取输入音频,提取输入音频的分组特征;B2、将输入音频的分组特征输入分组模型,预测性地输出该输入音频的标签;B3、根据该输入音频的标签,将用该标签对应的组别的最优降噪策略处理后的音频得到的转录文本作为该输入音频的转录文本。本发明实施例的技术方案能够根据输入音频的对抗扰动的大小,预测其所属的组别,为其选择适于该组别的降噪策略进行降噪,可以降低转录的错误率,而且可以在保证在对抗转录恢复为原始转录的同时,不会影响干净样本的转录质量。

    一种图像分类模型的训练方法和训练系统

    公开(公告)号:CN116310577A

    公开(公告)日:2023-06-23

    申请号:CN202310314936.0

    申请日:2023-03-28

    Inventor: 孙自浩 胡瑜

    Abstract: 本发明提供了一种图像分类模型的训练方法和训练系统,方法包括:A1、获取构建的超网络,超网络包括多个网络层和预测层,所述超网络的网络层包括多个候选操作和用于评价每个候选操作的重要性的基于自注意力机制的指示网络;A2、利用训练集对超网络进行图像分类训练,其中包括对每个候选的网络结构和指示网络的训练;A3、将验证集的图像样本输入经步骤A2训练的超网络中以得到指示网络根据验证集评价的各网络层的每个候选操作的重要性;A4、根据验证集评价的各网络层的每个候选操作的重要性,从超网络的每个网络层选择重要性较高的候选操作与预测层构建目标网络;A5、利用训练集和/或验证集对目标网络进行图像分类训练,得到经训练的图像分类模型。

    相机与激光雷达组合传感器的外参数标定方法及系统

    公开(公告)号:CN110021046B

    公开(公告)日:2021-11-19

    申请号:CN201910164594.2

    申请日:2019-03-05

    Inventor: 刘世策 胡瑜

    Abstract: 本发明涉及一种相机与激光雷达组合传感器的外参数标定方法,包括:将该组合传感器对准一个标定装置,进行一次扫描,获得该标定装置在激光雷达坐标系中的第一坐标、在图像坐标系中的第二坐标和在相机坐标系中的第三坐标;通过该第一坐标和该第二坐标,获取标定装置坐标系至该激光雷达坐标系的第一变换矩阵;通过第三坐标和该第二坐标,获取该相机坐标系至该标定装置坐标系的第二变换矩阵;通过该第一变换矩阵和该第二变换矩阵,获得该相机坐标系至该激光雷达坐标系的外参数矩阵。本发明操作简便、计算简单,标定设备易获得,提高了结果的精度和方法的可优化性。

    一种深度渐进且逐步寻优的神经网络架构搜索方法与系统

    公开(公告)号:CN112381208A

    公开(公告)日:2021-02-19

    申请号:CN202011268902.5

    申请日:2020-11-13

    Inventor: 陆顺 胡瑜

    Abstract: 本发明提出一种深度渐进且逐步寻优的神经网络架构搜索方法与系统,包括:步骤1、构建包含和不包含下采样操作的第一搜索单元和第二搜索单元,堆叠第一搜索单元和第二搜索单元,形成超网;步骤2、通过梯度下降法搜索得到超网的有向无环图中每个边的每个操作的权重系数,每条边通过选择边对应操作中权重系数最大的操作,得到每条边最终搜得的操作结果,以操作结果分别更新第一搜索单元和第二搜索单元,得到第一更新单元和第二更新单元,堆叠第一更新单元和第二更新单元,得到单模型;步骤3、判断单模型深度是否小于目标模型深度,若是,将预设递增数量的第一搜索单元堆叠至单模型,形成超网,再次执行步骤2,否则将单模型作为神经网络搜索结果。

    基于多模态数据的多任务学习方法及系统

    公开(公告)号:CN112183547A

    公开(公告)日:2021-01-05

    申请号:CN202011116788.4

    申请日:2020-10-19

    Inventor: 李洁 胡瑜

    Abstract: 本发明提供了基于多模态数据的多任务学习方法及系统,包括获取用于完成多个任务的多模态数据,将所述多模态数据按模态种类进行分组,并进行时空对齐;从所述对齐后的多模态数据中提取每种模态内数据的硬共享特征,基于所述硬共享特征获得每种模态内与不同任务相关的软共享特征,基于所述软共享特征获得每种模态内与不同任务相关的非共享特征,并基于所述非共享特征获得与所述多个任务中的每种任务对应的数据特征;基于所述对应的数据特征执行所述多个任务,并计算所述多个任务中每种任务的损失函数;利用不确定度损失加权计算所述多任务学习方法的总体损失函数,以训练所述多任务学习方法。本发明实施例的技术方案能够充分利用多模态数据间的互补性,快速、准确的完成多任务学习,实现轻量化。

    一种训练用于语音分组的分组模型的方法和语音降噪方法

    公开(公告)号:CN111462737A

    公开(公告)日:2020-07-28

    申请号:CN202010225558.5

    申请日:2020-03-26

    Abstract: 本发明实施例提供了一种训练用于语音分组的分组模型的方法和语音降噪方法,该语音降噪方法包括:B1、获取输入音频,提取输入音频的分组特征;B2、将输入音频的分组特征输入分组模型,预测性地输出该输入音频的标签;B3、根据该输入音频的标签,将用该标签对应的组别的最优降噪策略处理后的音频得到的转录文本作为该输入音频的转录文本。本发明实施例的技术方案能够根据输入音频的对抗扰动的大小,预测其所属的组别,为其选择适于该组别的降噪策略进行降噪,可以降低转录的错误率,而且可以在保证在对抗转录恢复为原始转录的同时,不会影响干净样本的转录质量。

    一种基于卷积神经网络进行目标检测的方法

    公开(公告)号:CN111461145A

    公开(公告)日:2020-07-28

    申请号:CN202010244313.7

    申请日:2020-03-31

    Inventor: 唐乾坤 胡瑜

    Abstract: 本发明提供一种基于卷积神经网络进行的目标检测方法,包括:提取特征图并设置若干不同的预设框;将所述预设框进行回归以调整其位置和大小;基于所述回归后的预设框提取其对应的局部卷积特征;将所述局部卷积特征输入卷积预测器进行分类和回归,获得目标的边界框位置和目标的类别,其中,所述卷积预测器是通过将所述预设框进行分类并选择正例预设框来训练获得。

Patent Agency Ranking