-
公开(公告)号:CN109920013B
公开(公告)日:2020-11-10
申请号:CN201910091997.9
申请日:2019-01-30
Applicant: 北京交通大学
IPC: G06T9/00
Abstract: 本发明提供一种基于渐进式卷积测量网络的图像重构方法和装置,属于图像重构技术领域。该方法首先通过多个下采样层对原始图像进行渐进式卷积运算,再通过下采样特征提取层生成满足给定的测量率下的对应数量的特征图;然后通过与所述多个下采样层相对应的多个上采样层对所述特征图进行渐进式反卷积运算,再通过上采样特征提取层生成与所述原始图像大小一致的初步重构图像;最后利用残差卷积神经网络对所述初步重构图像进行质量优化训练,获取最终特征图,通过对最终特征图与原始图像进行误差处理,获取最终优化的重构图像。本发明中图像被端到端地采样和重构,重构速度快,尤其在极低测量率下,消除了重构图像中的块效应,图像质量得到明显的提高。
-
公开(公告)号:CN110969089A
公开(公告)日:2020-04-07
申请号:CN201911059976.5
申请日:2019-11-01
Applicant: 北京交通大学
Abstract: 本发明提供了一种噪声环境下的轻量级人脸识别系统及识别方法,属于计算机人脸识别技术领域,首先,输入噪声图片,使用3×3卷积核提取特征,然后添加去噪块,对卷积层提取到的特征进行特征去噪,然后使用深度可分离卷积,以及十层瓶颈结构,最后通过1×1卷积和线性全局深度可分离卷积得到输出特征。本发明提出了可以方便的与任何卷积神经网络结构相结合的有效独立的去噪声模块--LD-MobileFaceNet;在去噪操作中,采用非局部均值去噪方法提高了MobileFaceNet的性能,提高了噪声环境下的人脸识别准确率;移除了网络中部分的瓶颈层,使系统更加轻量化,在噪声数据集上实现了更好的鲁棒性;非线性激活函数swish代替PReLU,弥补了识别精度的损失,保证了不同噪声等级下的识别准确率。
-
公开(公告)号:CN107547895A
公开(公告)日:2018-01-05
申请号:CN201610506563.7
申请日:2016-06-29
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Inventor: 白慧慧
IPC: H04N19/115 , H04N19/136
Abstract: 本发明实施例公开了一种图像处理方法,包括:获取初始图像;对所述初始图像进行划分,得到至少两个待编码数据块;计算所述至少两个待编码数据块的至少两个图像分布特征值;基于所述至少两个图像分布特征值,分别确定针对所述至少两个待编码数据块的处理方式;其中,所述处理方式至少包括第一处理方式和第二处理方式;所述第一处理方式表征直接对待编码数据块进行编码;所述第二处理方式表征将待编码数据块再次进行划分得到至少两个待编码子数据块,以基于所述至少两个待编码子数据块完成对所述至少两个待编码数据块的处理过程。本发明实施例还公开了一种图像处理装置。
-
公开(公告)号:CN100512446C
公开(公告)日:2009-07-08
申请号:CN200710119031.9
申请日:2007-06-18
Applicant: 北京交通大学
Abstract: 本发明提供一种基于自适应时域亚采样的多描述视频编解码方法,包含:通过自适应时域亚采样调整原始视频序列的运动信息;将调整后的视频序列分成具有一定相关性的两路视频子序列,分别进行压缩后将生成两个描述在信道传输;如果所述两个描述同时收到,则对两个描述进行中心解码,得到较高质量的重建视频;如果只收到单路描述,则对其进行单路解码,得到可接受质量的重建视频。本发明的优点在于:在保证视频编码压缩性能的前提下,提高了视频传输的可靠性,有利于在复杂的网络情况下实现可靠传输;对现有的标准信源编解码器以及信道编解码器没有做任何改动,易于兼容现有的视频标准。
-
公开(公告)号:CN119128622A
公开(公告)日:2024-12-13
申请号:CN202411029585.X
申请日:2024-07-30
Applicant: 中国电子科技集团公司第五十四研究所 , 北京交通大学
IPC: G06F18/241 , H04L67/10 , H04L67/12 , G06F18/2415 , G06F18/213 , G06F18/23 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于协同进化的无人机具身智能可靠感知方法,属于无人机安全飞行技术领域,其包括:利用聚类分析算法处理被观测无人机信息,得到无人机摆动幅度物理条件;利用设定的协同进化模型对无人机摆动幅度物理条件进行飞行可靠感知处理,得到与无人机摆动幅度物理条件对应的飞行姿态可靠感知参数,利用无人机摆动幅度物理条件以及飞行姿态可靠感知参数构建被观测无人机摆动幅度物理条件边缘计算网关;将被观测无人机摆动幅度物理条件边缘计算网关生成被观测无人机摆动幅度物理条件边界阈值,将被观测无人机摆动幅度物理条件边界阈值发送至具身智能数据处理平台,并对模型进行迭代;本发明保证了无人机的飞行安全,节约了硬件成本。
-
公开(公告)号:CN117392380B
公开(公告)日:2024-08-06
申请号:CN202311112314.6
申请日:2023-08-31
IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06V20/70 , G06N3/0464 , G06N3/08
Abstract: 本发明多角度碲锌镉晶片图像语义分割方法属于图像质量增强领域,本发明先利用获取到的CZT图像进行n+1数据集的构建,然后利用渐进式互补知识汇聚网络PCKA通过像素汇聚网络PAN和潜在汇聚网络LAN进行像素层级、潜在层级的知识表征,最终提高了CZT图像分割的质量与速度,本发明适合于一些要求要求多角度获取图像并进行语义分割的应用场合,如半导体材料分割等。
-
公开(公告)号:CN118301366A
公开(公告)日:2024-07-05
申请号:CN202410226307.7
申请日:2024-02-29
Applicant: 北京交通大学
IPC: H04N19/51 , H04N19/86 , H04N19/172
Abstract: 本发明提供了一种双向帧间预测引导的视频编码方法。该方法包括:编码端基于参考帧采用双向预测方法对待编码的中间帧进行初步预测,生成预测帧;通过残差引导的编码器组件编码所述中间帧和所述预测帧之间的差异,生成潜在特征;解码端基于参考帧通过双向预测网络得到预测帧,将所述潜在特征补偿到所述预测帧上,生成重建的中间帧。本发明方法使用伪影去除编码器来识别伪影的出现区域,利用预测帧与目标帧之间的残差作为关键区域的引导,使得编码的码率能够有针对性地聚焦在伪影区域上。在解码端时空先验解码器运用已经编码帧间的关联性来恢复当前帧,有效地减少了对重复信息的编码。
-
公开(公告)号:CN111583173B
公开(公告)日:2023-12-01
申请号:CN202010199264.X
申请日:2020-03-20
Applicant: 北京交通大学
Abstract: 本发明涉及一种RGB‑D图像显著性目标检测方法,包括如下步骤:1、从VGG主干网络中提取自顶向下的RGB‑D特征,然后将RGB‑D特征送入跟每个层级相对应的跨模态调制与选择单元;2、通过跨模态特征调制模块对多级RGB‑D特征进行调制;3、通过自适应特征选择模块得到与显著性相关的特征;通过显著显著性边缘预测部分生成显著性边缘图;4、求得修正特征;5、利用修正特征通过显著性图预测部分进行显著性图预测,并以第1层级输出的显著性图作为网络的最终输出显著性结果。本发明能够充分挖掘跨模态数据之间的互补信息,获得更具判别力的特征表达,生成更加完整、准确、边缘清晰的显著性图,且具有较强的背景抑制能力。
-
公开(公告)号:CN116767533A
公开(公告)日:2023-09-19
申请号:CN202310831376.6
申请日:2023-07-07
Applicant: 中国电子科技集团公司第五十四研究所 , 北京交通大学
IPC: B64U30/291 , B64U30/292 , B64U10/70 , B64U10/14 , B63B1/40 , B63B1/32
Abstract: 本发明公开了一种海空跨域无人机,涉及无人机技术领域,包括机体,所述机体的外部固定连接有连杆,所述连杆的一端固定连接有电机,所述电机的输出轴固定连接有传动杆,所述传动杆的顶部固定连接有安装板,所述安装板和套块的中部开设有螺纹槽。本发明通过采用安装板、螺纹槽、螺纹杆和转动柄的配合,转动转动柄带动螺纹杆转动,使螺纹杆沿螺纹槽卡紧或拆开安装板和套块,从而方便拆装第一扇叶和第二扇叶,解决了海空跨域无人机在长时间使用后,经常会出现飞行叶片受损的情况,需要及时拆卸更换,但现有的海空跨域无人机拆装复杂,影响海空跨域无人机的组装效率的问题,达到此海空跨域无人机具有方便拆装叶片的效果。
-
公开(公告)号:CN116437089B
公开(公告)日:2023-09-05
申请号:CN202310675512.7
申请日:2023-06-08
Applicant: 北京交通大学 , 航天恒星科技有限公司
IPC: H04N19/124 , H04N19/172 , H04N19/20 , H04N19/57 , H04N19/87 , H04N19/88 , H04N13/128
Abstract: 本发明提出一种基于关键目标的深度视频压缩算法,模型主要包括两部分。第一部分是基于长短期注意力机制的语义分割网络,该模块利用长期注意力机制和短期注意力机制以聚合目标的信息并学习时间平滑性,生成高质量的特征图,最后,通过解码器输出带有语义信息的帧序列。第二部分是基于残差编码的深度视频压缩网络DVC,通过对输入帧序列做运动估计提取运动信息,并将运动编解码后的运行信息做残差,然后对残差进行压缩,最后将重建的残差与运动信息相加重建帧序列。
-
-
-
-
-
-
-
-
-