一种可伸缩视觉计算系统
    31.
    发明公开

    公开(公告)号:CN112804188A

    公开(公告)日:2021-05-14

    申请号:CN202011425341.5

    申请日:2020-12-08

    Abstract: 本发明公开了一种可伸缩视觉计算系统,其特征在于,包括依次建立通信连接的前端设备、边缘服务以及云服务;所述前端设备,用于对采集的影像数据进行智能化分析处理,并根据配置相应地输出压缩视频流、特征编码流和结构化结果流;所述边缘服务,用于接收并存储所述前端设备发送的压缩视频流、特征编码流和结构化结果流,实时输出特征编码流和结构化结果流汇聚到云服务,根据云服务的数据调取指令按需输出压缩视频流至云服务;所述云服务,用于实时接收和汇聚边缘服务输出的特征编码流和结构化结果流,从所述边缘服务按需调取压缩视频流。本发明通过端、边、云三者之间优化分工和有机协作,实现对海量视频数据的实时处理和有效利用。

    一种交通事故检测方法、存储介质及设备

    公开(公告)号:CN112487961A

    公开(公告)日:2021-03-12

    申请号:CN202011364426.7

    申请日:2020-11-27

    Abstract: 本发明公开了一种交通事故检测方法、存储介质及设备,方法包括步骤:对筛选的交通数据进行预处理,构建交通事故数据集;将所述交通事故数据集中的每个原始视频样本视为一个包,对每个包进行空时域分割,得到与每个包对应的若干实例;根据所述交通事故数据集的弱标签属性构建事故检测模型,并基于所述每个包对应的若干实例对所述事故检测模型进行训练,得到训练后事故检测模型;根据所述训练后事故检测模型对测试视频进行端到端的交通事故检测。本发明提供的方法可有效提高交通事故检测率,降低误报率。

    一种车牌脱敏方法、终端及存储介质

    公开(公告)号:CN112215063A

    公开(公告)日:2021-01-12

    申请号:CN202010909591.X

    申请日:2020-09-02

    Abstract: 本发明公开了一种车牌脱敏方法、终端及存储介质。所述方法包括:获取目标视频,获取目标视频的每一帧中各个车辆对应的车辆空间信息,其中,车辆空间信息包括帧序号、车辆ID以及车辆位置信息;根据目标视频中每一帧中的各个车辆的车辆空间信息获取目标视频中每一帧中的各个车辆的第一车牌空间信息;根据第一车牌空间信息获取目标车牌空间信息;根据目标车牌空间信息对目标视频中的各个车牌进行脱敏处理。本发明通过对目标视频中的车辆进行跟踪,获取每一帧中各个车辆的车辆空间信息,再根据车辆的车辆空间信息获取每一帧中的车牌的车牌空间信息,进而根据车牌空间信息进行车牌脱敏处理,实现了对视频中的车牌信息进行脱敏。

    基于注意力和记忆机制的特征处理方法以及相关设备

    公开(公告)号:CN119598168A

    公开(公告)日:2025-03-11

    申请号:CN202411682122.3

    申请日:2024-11-21

    Abstract: 本申请提供了一种基于注意力和记忆机制的特征处理方法以及相关设备,方法包括:获取目标深度学习单元当前时刻对应的待输入数据;对当前输入数据进行编码处理和维度压缩,得到多个压缩向量;基于查询投影矩阵、键投影矩阵和值投影矩阵计算多个压缩向量对应的注意力权重,并根据多个注意力权重得到局部特征向量;基于记忆矩阵计算局部特征向量对应的多个全局特征向量,并对多个全局特征向量进行加权计算,得到多个记忆特征向量;对多个记忆特征向量进行特征融合以及维度还原,得到重构数据,以使目标深度学习单元基于重构数据进行训练,执行对应的深度学习任务,能够有效捕捉长时输入数据中的长期依赖关系,进而提高其模型性能。

    模型训练方法、装置、存储介质及计算机设备

    公开(公告)号:CN119377679A

    公开(公告)日:2025-01-28

    申请号:CN202411943704.2

    申请日:2024-12-27

    Abstract: 本申请实施例提供一种模型训练方法、装置、存储介质及计算机设备,包括:获取指定设备发送的多模态语言模型中任务视觉适配器及语言模型的聚合参数,依语言模型聚合参数更新本地语言模型,筛选出本地目标任务视觉适配器的目标聚合参数并更新。接着构建任务混合适配器,将目标任务视觉适配器替换,其包含概率预测器、各任务适配器及待训练跨任务适配器。最后通过本地样本数据集对任务混合适配器中的概率预测器、目标任务视觉适配器和语言模型进行训练,以此得到训练后的多模态语言模型。通过训练概率预测器与跨任务适配器来适配不同任务,让多模态模型能学到各任务特有的模式与特征,进而提升模型性能。

    视频图像的对象分割方法、装置、设备和存储介质

    公开(公告)号:CN119091361A

    公开(公告)日:2024-12-06

    申请号:CN202411572401.4

    申请日:2024-11-06

    Abstract: 本申请实施例提供视频图像的对象分割方法、装置、设备和存储介质,涉及图像处理技术领域。该方法计算测试特征向量和参考特征向量,再从时间特征数据库中得到目标特征向量,利用级联的多个多层次特征关联模块对目标特征向量、参考特征向量和测试特征向量进行特征提取,得到对象特征矩阵,基于时间特征数据库,确定对象特征矩阵在每个对象特征下的目标特征值,对目标特征值进行解码处理得到目标掩码结果。将自注意力过程解耦为三个子流,能够捕捉到微小目标,避免在特征提取过程中忽略重要特征。通过时间特征数据库关联历史视频帧中提取的信息,基于时序进行长期建模,更好地捕捉时空交互信息,增强对象特征的分割结果准确性。

    图像生成方法、装置、存储介质及计算机设备

    公开(公告)号:CN118898664A

    公开(公告)日:2024-11-05

    申请号:CN202411389339.5

    申请日:2024-10-08

    Abstract: 本申请实施例提供一种图像生成方法、装置、存储介质及计算机设备,包括:通过将表征目标对象不同部位的第一分割掩码以及目标对象在第二视角下的第一姿态图像输入至训练后的姿态编码器,以提取包含有每一部位的姿态的姿态特征。并通过分别将每个所述外观特征以及所述姿态特征输入至不同的训练后的部位特征生成器,以使不同的训练后的部位特征生成器分别处理不同部位在第二视角下的细节变化,使得最终生成的第二对象图像中的目标对象与第一对象图像中的目标对象在外观上的一致性更高,提高对象在不同的视角下的外观的精确性以及一致性。

    核心集构造方法、装置、设备及介质

    公开(公告)号:CN118135357B

    公开(公告)日:2024-08-27

    申请号:CN202410551155.8

    申请日:2024-05-07

    Abstract: 本申请实施例提供了核心集构造方法、装置、设备及介质,其中方法通过对图像数据集的图像数据进行特征提取;将图像数据集的数据特征映射至特征空间得到图像数据集的特征分布;对图像数据集的特征分布进行聚类得到类别数据的特征分布的中心特征;根据图像数据集的特征分布和中心特征确定图像数据集到核心集的分布间的代价矩阵;根据中心特征和代价矩阵确定图像数据集到核心集的分布间的最优传输距离矩阵;从图像数据集中确定使最优传输距离矩阵满足预设条件的目标图像数据并将目标图像数据组成核心集;能够有效地排除远离数据特征分布的噪声样本,并筛选出重要的样本组成核心集,进而起到加速模型训练的目的。

    一种生成车道级仿真路网的方法、设备及存储介质

    公开(公告)号:CN113887321B

    公开(公告)日:2024-08-23

    申请号:CN202111056068.8

    申请日:2021-09-09

    Abstract: 本发明涉及仿真路网领域,具体是涉及一种生成车道级仿真路网的方法、设备及存储介质。本发明首先获取街景所对应的图像以及街景所在位置的地图,对街景图像应用图像识别算法,识别出街景图像中的车道信息,相当于从街景图像中提取出车道,之后将提取出的车道匹配到地图上,得到仿真路网。这样就能够从地图这个全局上获知各个车道的信息。本发明是采用图像识别的方法获取到车道信息,相比较于人工实地采集车道信息,本发明的方法一方面降低了工作量,另一方面也能够提高获取到的仿真路网的准确性。另外,由于本申请的图像识别相较于现有技术中的人工采集车道信息,前者速度快,因此本发明可以及时更新仿真路网。

    物体定位方法、装置、设备及介质

    公开(公告)号:CN117975472B

    公开(公告)日:2024-06-21

    申请号:CN202410382411.5

    申请日:2024-04-01

    Abstract: 本申请实施例提供了物体定位方法、装置、设备及介质,通过在前向过程从层级的角度整合多层级的文本表征和图像表征,实现多模态自适应;在反向过程中,在冻结图像编码器深层的网络层组的权重矩阵的情况下,先更新浅层的网络层组的低秩矩阵并冻结浅层的网络层组的权重矩阵,逐步增加网络层组,在每次增加网络层组后重复更新低秩矩阵的过程;通过层级解耦,使图像编码器的学习率在不同适应阶段产生变化,保证图像编码器逐渐从浅层特征适应到深层特征,实现细粒度的跨模态特征的交互和对齐,通过逐步适应从浅层到深层的多层特征来逐步缩小预训练任务和定位任务的差距。

Patent Agency Ranking