一种深度模型与规则耦合的自动驾驶决策规划方法

    公开(公告)号:CN117657214A

    公开(公告)日:2024-03-08

    申请号:CN202311688848.3

    申请日:2023-12-11

    Applicant: 浙江大学

    Inventor: 龙钦应 杜歆

    Abstract: 本发明公开了一种深度模型与规则耦合的自动驾驶决策规划方法。该方法通过将基于规则的规划方法耦合到深度模型中,实现深度模型输出安全且舒适轨迹的自动驾驶决策规划任务。包括:基于Transformer算法的决策阶段,使用Transformer和注意力机制进行博弈交互,输出障碍物预测信息和自车控制信息;基于ILQR算法的规划阶段,进行轨迹优化,输出自车的安全且舒适的控制信息;更新网络参数阶段,构建损失函数,更新网络参数,反馈规划阶段的信息到决策阶段,最终输出最优轨迹。本发明兼顾博弈交互性高、安全性好、可泛化性强的特点,可用于城市道路等自动驾驶场合,尤其适用于存在多辆汽车障碍物的复杂城市道路场景。

    一种移动载体上激光雷达同时建图和内参标定方法

    公开(公告)号:CN116413706A

    公开(公告)日:2023-07-11

    申请号:CN202211614574.9

    申请日:2022-12-13

    Applicant: 浙江大学

    Inventor: 刘希尧 杜歆

    Abstract: 本发明公开了一种移动载体上激光雷达同时建图和内参标定方法。本发明根据激光雷达的工作原理和物理结构建立了修正测距偏差和测角偏差的内参模型,在载体行驶时连续的采集环境点云数据和运动数据,迭代的构建地图片段和更新内参数值,最终得到较为精确的激光雷达内参和场景地图。本发明使用运动补偿、面元估计、传感器融合等技术降低建图误差,通过优化地图片段中面元在多帧观测下的一致性来更新内参数值。

    一种软硬件协同的SM2椭圆曲线密码算法实现方法

    公开(公告)号:CN114650135A

    公开(公告)日:2022-06-21

    申请号:CN202210347648.0

    申请日:2022-04-01

    Applicant: 浙江大学

    Inventor: 邓尧慷 杜歆

    Abstract: 本发明公开了一种软硬件协同的SM2椭圆曲线密码算法实现方法。在CPU软件端运行SM2密码协议,将其中计算复杂度最高的标量乘运算通过软件/硬件接口交由FPGA硬件端执行;FPGA硬件端实现一个通用的高性能标量乘运算模块,快速完成标量乘运算并通过软件/硬件接口返回运算结果;软件端取回标量乘运算结果后继续执行协议,向上层应用返回协议结果。该方法在软件端适配协议的更改,硬件端无需重新配置,具有运算性能高,通用性、可扩展性强的特点,可用于加密服务器等场合,尤其适用于有高吞吐的加密操作,且需要频繁更改使用的SM2密码协议的场景。

    一种基于加密流量数据的视频服务体验质量的识别方法

    公开(公告)号:CN109905696B

    公开(公告)日:2020-12-01

    申请号:CN201910019374.0

    申请日:2019-01-09

    Applicant: 浙江大学

    Inventor: 陈锐 杜歆

    Abstract: 本发明公开了一种基于加密流量数据的视频服务体验质量的识别方法。所述方法包括:获取视频播放时的加密流量文件以及相应的事件信息;对所述的事件信息进行处理,以确定该次播放的QoE等级;对所述的加密流量文件进行预处理,得到TCP流数据;以所述的QoE等级作为标签,所述的TCP流数据作为特征,构建端到端的深度学习模型;所述模型可根据加密流量文件识别视频播放的QoE等级。本发明提供的视频QoE等级识别方法,能够准确的对视频QoE等级进行识别,并且提供了完全自动化的方案。

    一种基于深度神经网络的算法生成恶意域名检测方法

    公开(公告)号:CN109450845B

    公开(公告)日:2020-08-04

    申请号:CN201811090443.9

    申请日:2018-09-18

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度神经网络的算法生成恶意域名检测方法。该检测方法的核心组件是一个多层深度神经网络。所述的多层深度神经网络包括:输入层、预处理层、域名表示层、特征提取层、分类层和输出层。输入层直接接受字符形式编码的域名字符串;预处理层用于提取域名的主体部分;域名表示层通过n‑gram表示方法,将域名信息组织成一个二维张量;特征提取层使用分块卷积结构提取特征;分类层由神经网络分类器构成,利用特征进行分类;输出层用于输出归一化概率。本发明对多数恶意域名,尤其是基于单词表和可发音的算法生成恶意域名检测效果良好,有实际应用价值。

    一种基于视频评论文本的视频标签确定方法

    公开(公告)号:CN111046233A

    公开(公告)日:2020-04-21

    申请号:CN201911347396.6

    申请日:2019-12-24

    Applicant: 浙江大学

    Inventor: 王瑞琛 杜歆

    Abstract: 本发明公开了一种基于视频评论文本的视频标签确定方法。该方法包括:(1)对视频评论进行数据清洗以及预处理;(2)使用预处理后的评论文档D以及对应的视频标签训练多层注意力网络模型;(3)将目标视频的评论文档输入至训练好的多层注意力网络模型,确定目标视频的标签。本发明提供的视频标签确定方法,能有效确定视频所需对应的标签。

    一种鱼眼镜头相机径向畸变的自标定方法

    公开(公告)号:CN104036496A

    公开(公告)日:2014-09-10

    申请号:CN201410221337.5

    申请日:2014-05-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种鱼眼镜头相机径向畸变的自标定方法,包括以下步骤:将鱼眼镜头相机围绕相机坐标系的y轴进行旋转,拍摄前后视野有重叠的n个视角的图像;提取不同视角下鱼眼图像的图像特征点,并进行特征点匹配,得到m条不同视角下鱼眼图像的匹配点轨迹序列;利用得到的m条图像匹配点轨迹序列,通过非线性优化求解得到畸变中心和畸变参数;本发明无需特定的标定物,只需将鱼眼镜头相机围绕着相机坐标系的y轴进行旋转,拍摄前后视野有重叠的若干幅图像,通过对图像特征点运动轨迹的分析计算即可求解出畸变参数。相比传统基于模板的标定方法,本方法带来了极大的便利性。

    基于仿射变换的立体视频匹配方法

    公开(公告)号:CN102026013B

    公开(公告)日:2012-05-23

    申请号:CN201010594217.1

    申请日:2010-12-18

    Applicant: 浙江大学

    Inventor: 杜歆 张飞 陈国赟

    Abstract: 本发明公开了一种基于仿射变换的立体视频匹配方法。该方法用于对双目摄像机拍摄得到的立体视频进行立体匹配,包括以下步骤:1)提取当前帧图像和前一帧图像的特征点并进行匹配,求取当前帧图像到前一帧图像的仿射变换矩阵;2)根据仿射变换矩阵,将当前帧图像的像素点投影到前一帧;3)计算前后帧匹配点的像素差,以检测当前帧图像中的静止区域;4)计算当前帧图像的初始匹配代价;5)更新当前帧图像静止区域的匹配代价;6)计算当前帧图像的视差图。本发明利用了视频帧之间的仿射约束关系,使得当前帧视差同时受前一帧视差的约束,有效地减弱了噪声等对视差精度的影响;提高了视差在视频中的稳定性,保证了视差图序列在时域上的稳定性。

    一种降低深度神经网络训练过程中GPU内存占用的方法

    公开(公告)号:CN114358267B

    公开(公告)日:2025-04-04

    申请号:CN202210006073.6

    申请日:2022-01-05

    Applicant: 浙江大学

    Inventor: 欧岳枫 杜歆

    Abstract: 本发明公开了一种降低深度神经网络训练过程中GPU内存占用的方法。该方法适用于基于CPU‑GPU异构计算平台上的深度神经网络(DNN)框架,提供基础‑通常‑极致三个等级的内存优化选项,通过静态计算图分析实现运行时零开销的内存分配,通过启发式搜索选择适当的算子重计算策略,同时分析并限制Cudnn库卷积算法的额外内存开销。用户仅需通过一个参数的优化等级控制,即可实现神经网络训练过程中的内存占用优化。

    一种用于自动驾驶场景的拟真图像生成方法

    公开(公告)号:CN119228932A

    公开(公告)日:2024-12-31

    申请号:CN202411370318.9

    申请日:2024-09-29

    Applicant: 浙江大学

    Inventor: 曹世聪 杜歆

    Abstract: 本发明公开了一种用于自动驾驶场景的拟真图像生成方法,用于生成拟真自动驾驶合成图像数据集。本发明通过将自动驾驶仿真平台和图像拟真算法结合,在真实图像域和合成图像域之间构建了语义分割图、轮廓图、文本描述结合的多模态域,将图像拟真任务从合成图像域到真实图像域的映射转变为多模态域到真实图像域的映射,从而缩小了域偏差,降低了拟真难度。本发明采用开源的模型生成了真实图像的语义分割图、轮廓图、文本描述作为训练数据,从而构建了多模态域和真实图像域相对应的训练数据集,降低了训练难度。在生成时,本发明采用合成数据集的语义分割图、轮廓图、文本描述用于拟真图像生成。本发明的优点在于:生成图像的拟真性好,内容可控。

Patent Agency Ranking