-
公开(公告)号:CN117037117A
公开(公告)日:2023-11-10
申请号:CN202311051356.3
申请日:2023-08-17
Applicant: 浙江大学
Abstract: 本发明公开了一种基于栅格坐标系下多特征融合的高效障碍物检测方法,包括:(1)从时序激光雷达点云数据与相机数据中获取同帧数据;(2)将激光雷达点云数据通过手工制作特征得到栅格坐标系下的激光雷达栅格特征;(3)将同一时刻的多视角相机数据进行特征提取得到二维图像特征I;(4)通过注意力投射模块,利用激光雷达栅格特征将二维图像特征I投影到三维空间,转换成相机栅格特征;(5)将步骤(2)和(4)得到的激光雷达栅格特征和相机栅格特征进行融合得到混合特征;(6)将步骤(5)得到的混合特征通过语义分割网络实现最终的栅格地图下的障碍物检测。本发明不仅很好地保留了几何和语义的信息,同时大大减少了障碍物检测时间。
-
公开(公告)号:CN116702267A
公开(公告)日:2023-09-05
申请号:CN202310445101.9
申请日:2023-04-24
Applicant: 浙江大学
IPC: G06F30/13 , G06F30/20 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于无规则多边形检测的飞机跑道检测方法,包括以下步骤:(1)获取飞行模拟软件生成虚拟跑道图像以及对应的标注数据,作为主要训练数据;(2)获取现实飞行环境中拍摄的跑道图像,标注后作为次要训练数据;(3)构建预训练好的深度神经网络模型,将模型中的顶层loss设置为跑道所在四边形的四个顶点位置;(4)将主要训练数据和次要训练数据按比例混合后对深度神经网络模型进行训练,直到模型的损失函数收敛;(5)利用训练后的深度神经网络模型对待测跑道图片进行分析,预测图像中跑道的四个顶点的位置。本发明采用四个自由度的输出预测代替矩形框,更贴近跑道轮廓,提高了识别的精准度和效率。
-
公开(公告)号:CN116229398A
公开(公告)日:2023-06-06
申请号:CN202310202547.9
申请日:2023-03-06
Applicant: 浙江大学
IPC: G06V20/56 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于置信学习和多任务学习的辅助驾驶AI中台系统,包括数据处理模块,用于接收原始数据,利用置信学习进行数据标注和筛选,构建数据集;模型构建模块,用于构建多任务模型的编码器、解码器,并为任务相关性较强的模型提供上下文信息传递通路和融合池化增强模块,使解码器的上下文进行交互;模型训练模块,用于定义和训练参数,训练到指定次数或精度后转化并输出模型;模型部署监控模块,用于将最佳模型进行设备端部署,同时在云端进行实时监控;并将模型效果差的场景数据进行保存回传,构成新的数据集。本发明有效利用简单任务对复杂任务进行辅助,并对简单任务的部分损失进行弥补,最终能够提升辅助驾驶感知的识别准确率。
-
公开(公告)号:CN119295736A
公开(公告)日:2025-01-10
申请号:CN202411415622.0
申请日:2024-10-11
Applicant: 浙江大学
Abstract: 本发明公开了一种定位时动态物体检测与过滤方法,包括以下步骤:(1)通过相机与激光雷达的外参,将激光点云投影到相机像素平面;(2)通过目标检测算法检测相机图像中潜在动态物体,并将潜在动态物体对应检测框中的点云标记为潜在动态点;计算潜在动态点在整体点云中的比例,并将其余点加入静态点云;(3)设置动态点云阈值,基于目标检测框物体类别,动态设置质心欧式距离的阈值;(4)根据步骤(2)中潜在动态点云在整体点云中的比例,自适应进行不同策略的潜在动态点云过滤,获取静态点云;(5)利用过滤得到的静态点云进行定位。利用本发明,可以提高定位与建图效果,具有鲁棒性强、检测精度高、实时性好等优点。
-
公开(公告)号:CN118334242A
公开(公告)日:2024-07-12
申请号:CN202410427179.2
申请日:2024-04-10
Applicant: 浙江大学
IPC: G06T17/00 , G06Q10/087
Abstract: 本发明公开了一种基于分层强化学习的出口集装箱堆场存储位置分配方法,该将即时翻箱率和即时箱区均衡度作为奖励函数的元素,使得出口集装箱排序过程、箱区分配过程和箱位分配过程中充分考虑到堆场内同一航线出口集装箱的均衡分布情况和翻箱情况,降低了后续出口集装箱的装载难度,提升了堆场的并行效率,减少船舶装箱时间。
-
公开(公告)号:CN117892818A
公开(公告)日:2024-04-16
申请号:CN202410303342.4
申请日:2024-03-18
Applicant: 浙江大学
IPC: G06N5/022 , G06N5/04 , G06F16/332 , G06F16/36
Abstract: 本发明公开了一种基于隐式思维链的大语言模型推理性内容生成方法,该方法主要包括:利用预训练大语言模型的问答能力,通过提问的方式促使模型生成文本形式的思考过程;将其思考过程输入进文本嵌入模型提取思考过程的高维隐式嵌入;将高维的隐式嵌入作为大语言模型的输入,替代原有的思维链过程,引导大语言模型输出正确的推理结果。本发明充分利用大语言模型的少样本模仿能力,同时利用其能够借助推理过程得出正确答案的特性,提升了大语言模型在推理相关问题上的表现性能,准确性优于现有方法,并且具有较强的通用性,适用于任意大语言模型针对任意推理类问题的生成。
-
公开(公告)号:CN117237709A
公开(公告)日:2023-12-15
申请号:CN202311150654.8
申请日:2023-09-07
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06F17/16 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于模型输出差值矩阵知识蒸馏的图像分类方法及装置,包括:(1)将训练集图片分别输入待训练的学生模型和已训练的教师模型,分别输出对应的逻辑分类值;(2)分别计算每个逻辑分类值之间的两两差值,构建两个差值矩阵;(3)计算两个差值矩阵之间的区别度,作为蒸馏损失函数;(4)同时计算学生模型的逻辑分类值和图片真实分类标签的交叉熵,作为分类任务的损失函数,与蒸馏损失函数相加后得到训练学生模型的最终损失函数;(5)向前传递梯度以更新学生模型的参数,教师模型的参数保持不变;(6)重复以上步骤进行训练,并将训练完毕的学生模型进行图片分类。利用本发明,可以提高在图片分类任务上进行知识蒸馏的效果。
-
公开(公告)号:CN116543233A
公开(公告)日:2023-08-04
申请号:CN202310638294.X
申请日:2023-06-01
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/82 , G06F18/243
Abstract: 本发明公开了一种基于频繁项集的图像多标签分类方法,包括如下步骤:(1)在图像数据集中,使用频繁项集挖掘算法挖掘出数据集的频繁项集;(2)利用挖掘出的频繁项集构建树形结构的图像多标签分类网络;(3)将特征提取网络和图像多标签分类网络结合得到总分类网络,其中,特征提取网络输出的特征向量作为图像多标签分类网络的输入;(4)训练总分类网络模型直至模型收敛;(5)将待分类的图像输入训练好的总分类网络模型中,得到多标签的分类结果。本发明通过频繁项集挖掘算法生成的频繁项集自动生成更为合理的图像多标签分类网络,可以提供更高的图像多标签分类精度。
-
公开(公告)号:CN116246117A
公开(公告)日:2023-06-09
申请号:CN202310297826.8
申请日:2023-03-23
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06N20/00
Abstract: 本发明公开了一种适用于非独立同分布情况且具有隐私保护的图像分类方法,包括:(1)随机生成一个ETF结构;(2)用ETF结构初始化全局图像分类系统;(3)从所有的客户端中随机抽取K个客户端;(4)对于被抽到的客户端,首先初始化为全局图像分类系统,然后用其私有数据更新特征抽取模型,更新时考虑记忆向量;(5)使用步骤(4)所有客户端的特征向量更新记忆向量;(6)用客户端的局部图像分类系统更新全局图像分类系统;(7)重复步骤(3)~(6),直到目标函数的损失值收敛;(8)将待分类的图像输入训练完的全局图像分类系统,得到图像分类结果。利用本发明,可以大大提升在非独立同分布数据集上基于联邦学习的图像分类质量。
-
-
-
-
-
-
-
-