-
公开(公告)号:CN119089225A
公开(公告)日:2024-12-06
申请号:CN202411206210.6
申请日:2024-08-30
Applicant: 浙江大学
IPC: G06F18/231 , G06F18/27 , G06F18/213 , G06F18/25 , G06N5/04 , G01C21/34 , G01C21/36
Abstract: 本发明公开了一种基于候选车道和速度嵌入的多模态轨迹预测和规划一体化方法,包括:基于目标障碍物位置和高精地图采样其候选车道,对候选车道做聚类并过滤;将目标障碍物的信息和候选车道信息输入特征融合模块和候选车道打分模块,得到对候选车道的打分;对候选车道做速度嵌入,得到含有不同纵向行为的候选车道信息,将其送入轨迹回归模块得到预测轨迹;将预测轨迹送入轨迹打分模块,得到多模态轨迹的置信度;自车轨迹规划与上述轨迹预测的步骤大致相同;将目标障碍物的预测轨迹和自车的规划轨迹送入Cost打分模块进行综合评分。本发明基于候选车道和速度嵌入得到预测和规划轨迹,使得模型的预测和规划精度更高的同时拥有低延迟和可解释性强的特点。
-
公开(公告)号:CN117172104A
公开(公告)日:2023-12-05
申请号:CN202311045196.1
申请日:2023-08-18
Applicant: 浙江大学 , 宁波舟山港集团有限公司
IPC: G06F30/27 , G06F119/14
Abstract: 本发明公开了一种基于深度学习的集装箱车辆纵向动力学的加速度预测方法。预先建立一个深度神经网络模型,采集集装箱车辆在加速度已知情况下的纵向动力学参数、车辆自身参数和环境参数,并结合已知的加速度输入到深度神经网络模型中进行训练,然后利用训练后的深度神经网络模型针对待测情况下的集装箱车辆进行加速度预测。本发明能够在各种工况下,保持模型输出的加速度与测量值基本一致,同时显著减小了测量噪声;模型输出的速度与测量值基本一致,显著减小了预测误差,保证模型的最终输出精度。
-
公开(公告)号:CN115346210A
公开(公告)日:2022-11-15
申请号:CN202210995638.8
申请日:2022-08-18
Applicant: 浙江大学
Abstract: 本发明公开了一种基于单目相机的3D目标检测方法,包括:(1)根据单目相机的成像规则,对于每一个真实目标O,按比例生成具有相似成像的伪目标O′,构成图像数据集;(2)根据设计的质量分数函数,计算伪目标O′的质量分数;(3)使用深度网络提取图像数据集中每一张图像的特征F;(4)利用多层感知机,根据图像的特征F预测物体的3D信息以及预测目标的质量分数;(5)以步骤(2)得到的带有质量分数的伪目标O′和真实目标O作为监督信息,与步骤(4)的预测结果计算损失函数;(6)通过梯度反向传播,训练深度网络和多层感知机;(7)深度网络和多层感知机训练完毕,进行3D目标检测的应用。利用本发明,可大大提升单目目标检测的质量。
-
公开(公告)号:CN112199535B
公开(公告)日:2022-08-30
申请号:CN202011058365.1
申请日:2020-09-30
Applicant: 浙江大学
IPC: G06F16/55 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/02 , G06N3/08
Abstract: 本发明公开了一种基于集成知识蒸馏的图像分类方法,包括以下步骤:(1)预训练教师模型,将教师模型的训练过程分为三个阶段,从每个阶段中取出一个最好的教师模型,得到3个教师模型T1、T2和T3;(2)训练学生模型,将学生模型的训练过程划分为三个阶段,每个阶段用得到的三个教师模型来联合指导学生模型;其中,T3在每个阶段的权重保持不变;T1在第一阶段权重最大,T2在第二阶段权重最大;(3)使用训练好的学生模型进行图片分类任务,输入待分类图片,进行分类预测。利用本发明,使得学生模型从教师模型中学习知识变得简单,从而进一步提高学生模型的性能,在提高模型响应速度的同时保证图像分类的精度。
-
公开(公告)号:CN111881828B
公开(公告)日:2022-05-06
申请号:CN202010738838.6
申请日:2020-07-28
Applicant: 浙江大学
IPC: G06V20/58 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774
Abstract: 本发明公开了一种面向移动端设备的障碍物检测方法,包括:(1)选择障碍物检测模型;(2)将训练完的检测模型的识别准确率a作为因变量,模型的深度d、宽度w和图片大小r作为自变量;(3)分别对模型的深度d、宽度w和图片大小r进行剪枝,并在数据集上对模型进行微调,用函数f拟合a与d、w、r之间的关系;(4)通过优化函数求解最优的深度、宽度和图片大小(dm,wm,rm),并根据求得的(dm,wm,rm),导出对应的精简模型结构;(5)在数据集上对精简模型进行训练;(6)在移动端设备运行精简模型,实时输入周围的环境照片,进行障碍物识别。本发明使深度卷积神经网络可以满足移动端设备的流畅性要求,同时使障碍物检测具有较高的准确率。
-
公开(公告)号:CN112199535A
公开(公告)日:2021-01-08
申请号:CN202011058365.1
申请日:2020-09-30
Applicant: 浙江大学
Abstract: 本发明公开了一种基于集成知识蒸馏的图像分类方法,包括以下步骤:(1)预训练教师模型,将教师模型的训练过程分为三个阶段,从每个阶段中取出一个最好的教师模型,得到3个教师模型T1、T2和T3;(2)训练学生模型,将学生模型的训练过程划分为三个阶段,每个阶段用得到的三个教师模型来联合指导学生模型;其中,T3在每个阶段的权重保持不变;T1在第一阶段权重最大,T2在第二阶段权重最大;(3)使用训练好的学生模型进行图片分类任务,输入待分类图片,进行分类预测。利用本发明,使得学生模型从教师模型中学习知识变得简单,从而进一步提高学生模型的性能,在提高模型响应速度的同时保证图像分类的精度。
-
公开(公告)号:CN119394296A
公开(公告)日:2025-02-07
申请号:CN202411490741.2
申请日:2024-10-24
Applicant: 浙江大学
Abstract: 本发明公开了一种基于多传感器融合的飞机自动起降位姿感知方法及系统,包括:(1)根据IMU、相机和GPS传感器采集的数据实时感知飞机所处阶段,包括静止阶段、滑行起飞阶段、升空阶段、巡航阶段、降落阶段、落地减速阶段;(2)在滑行起飞阶段和落地减速阶段,使用Yolo检测跑道中线并计算飞机相对于跑道中线的偏角和偏移距离;(3)在升空阶段和降落阶段,对IMU、相机和GPS传感器数据进行融合,计算飞机相对于跑道的位置和朝向对应的六自由度位姿数据。本发明使用多传感器融合技术实时感知飞机所处阶段并计算位姿信息,可以有效提高计算精度和系统鲁棒性。
-
公开(公告)号:CN119359802A
公开(公告)日:2025-01-24
申请号:CN202411350776.6
申请日:2024-09-26
Applicant: 浙江大学
IPC: G06T7/73 , G06V20/56 , G06V10/80 , G06V10/82 , G06N3/0455
Abstract: 本发明公开了一种基础视觉模型的图像位置识别方法和装置,本发明公开的方法利用第一动态幂归一化层的动态幂,将具有丰富背景信息的特征进行增强,而将背景信息较少的特征进行减弱,甚至剔除,从而能够保留较多的背景信息,使得依赖于背景信息识别的VPR能够较为精准的识别查询图像的位置,本发明公开的方法还利用无质心探测模块进行聚合多个局部增强描述向量的同时,去除各个质心,从而减少参数量,使得训练更加的高效,并且避免质心对识别效果的影响。
-
公开(公告)号:CN118332417A
公开(公告)日:2024-07-12
申请号:CN202410427181.X
申请日:2024-04-10
Applicant: 浙江大学
IPC: G06F18/2411 , G06N3/126 , G06F18/214
Abstract: 本发明公开了一种基于深度强化学习的船舶配载方法,本发明通过退火遗传算法对历史配载数据进行操作得到大量的,较为准确的集装箱‑箱位映射关系,从而提供了大量的标签,同时将集装箱和箱位的空间信息和特征信息进行池化、卷积操作得到包含空间信息、特征信息和与其他集装箱相关联信息的嵌入向量,将该标签和嵌入向量作为训练样本,通过监督学习能够较好的训练出能够较为准确的预测集装箱‑箱位映射关系的演员网络,本发明还基于预测的集装箱‑箱位映射关系构建有向无环图,基于构建的有向无环图能够准确得到集装箱的配载顺序,综上两点本发明提供的方法能够在合理的时间内得到船舶配载问题的最优解,且复用性较高,本发明还公开了一种基于深度强化学习的船舶配载装置。
-
公开(公告)号:CN117892818B
公开(公告)日:2024-05-28
申请号:CN202410303342.4
申请日:2024-03-18
Applicant: 浙江大学
IPC: G06N5/022 , G06N5/04 , G06F16/332 , G06F16/36
Abstract: 本发明公开了一种基于隐式思维链的大语言模型推理性内容生成方法,该方法主要包括:利用预训练大语言模型的问答能力,通过提问的方式促使模型生成文本形式的思考过程;将其思考过程输入进文本嵌入模型提取思考过程的高维隐式嵌入;将高维的隐式嵌入作为大语言模型的输入,替代原有的思维链过程,引导大语言模型输出正确的推理结果。本发明充分利用大语言模型的少样本模仿能力,同时利用其能够借助推理过程得出正确答案的特性,提升了大语言模型在推理相关问题上的表现性能,准确性优于现有方法,并且具有较强的通用性,适用于任意大语言模型针对任意推理类问题的生成。
-
-
-
-
-
-
-
-
-