-
公开(公告)号:CN119360434A
公开(公告)日:2025-01-24
申请号:CN202411255283.4
申请日:2024-09-09
Applicant: 北京邮电大学 , 北京卓视智通科技有限责任公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0475
Abstract: 本发明涉及计算机视觉技术领域,具体公开一种基于多模型聚合的动作识别方法、系统、设备和存储介质,包括:获取目标域的每个样本视频对应的多个目标路径权重和聚合动作识别结果;基于每个样本视频对应的动作识别标签、聚合动作识别结果、实例级可转移性估计指标的量化值以及多个目标路径权重,计算损失值并迭代优化;将待测视频输入至训练好的路径生成网络,得到待测视频对应的多个目标路径权重,并根据待测视频对应的多个目标路径权重及相应训练好的源域模型,得到待测视频的聚合动作识别结果。本发明的方法通过提升源域模型到目标域场景的适应能力,从而提高了模型在目标域场景下的动作识别准确性。
-
公开(公告)号:CN119314134A
公开(公告)日:2025-01-14
申请号:CN202411428362.0
申请日:2024-10-14
Applicant: 北京卓视智通科技有限责任公司
IPC: G06V20/56 , G01C21/34 , G06V10/764 , G06N3/0464
Abstract: 本发明涉及道路检测技术领域,具体公开一种道路标识变化检测方法、系统、电子设备和存储介质,该方法包括:获取在不同时刻采集的含有目标道路区域的图像;利用道路标识检测模型,判断任意两个图像中,所述目标道路区域的每个预设局部区域内的道路标识是否发生变化。本发明能够实时检测道路标识的变化情况,避免了因车辆导航与实际路线不相符时所造成的安全隐患,提高了车辆通行效率。
-
公开(公告)号:CN119299650A
公开(公告)日:2025-01-10
申请号:CN202411330478.0
申请日:2024-09-24
Applicant: 北京卓视智通科技有限责任公司
IPC: H04N13/293 , H04N13/275 , G08G1/04
Abstract: 本发明公开了一种基于全息路口场景的双视频目标融合方法,涉及视频融合技术领域,方法包括:确定待拍摄区域中的至少一个车辆2D目标检测框以及每个车辆2D目标检测框对应的检测框底边中心像素坐标;通过像素映射关系以及每个车辆2D目标检测框对应的检测框底边中心像素坐标,将任一台相机对应的车辆2D目标检测框映射在另一台相机在同一时刻下采集到的图像场景中,将相同的目标车辆对应的车辆2D目标检测框以另一台相机在同一时刻下采集到的图像场景中对应的车辆2D目标检测框为主进行检测框融合。本发明可以有效的辅助每台相机确定更精确的车辆2D目标检测框对应的检测框底边中心像素坐标,以此来大幅度提升后续融合处理的准确性。
-
公开(公告)号:CN119064966A
公开(公告)日:2024-12-03
申请号:CN202410951593.3
申请日:2024-07-16
Applicant: 北京卓视智通科技有限责任公司
Abstract: 本发明公开了在遮挡场景下的目标轨迹预测方法、系统、设备及介质,涉及轨迹预测技术领域,方法包括:将检测区域内的每个目标车辆对应的位置信息实时更新至数据队列中;实时判断数据队列中的每个参数是否均进行更新处理,并将没有更新处理的参数对应的目标车辆确定为被遮挡目标车辆;通过被遮挡目标车辆对应的航向角以及GPS坐标,预测被遮挡目标车辆的新GPS坐标,更新被遮挡目标车辆在数据队列中的GPS坐标。本发明由于对实时更新的数据队列进行判断,因此轨迹预测的实效性更高,能够做到及时响应,提升了自动驾驶路口的安全性。
-
公开(公告)号:CN118840697B
公开(公告)日:2024-11-26
申请号:CN202411310740.5
申请日:2024-09-20
Applicant: 北京卓视智通科技有限责任公司
IPC: G06V20/40 , G06N20/00 , G06V10/77 , H04N21/845
Abstract: 本发明涉及一种基于大模型的长视频理解方法、装置、设备及介质,该方法包括:获取待处理视频;对所述待处理视频进行秒级抽帧,得到初步视频帧序列;根据所述初步视频帧序列的长度、第一大语言模型的上下文长度和第一设定长度,对所述初步视频帧序列进行划分,得到至少一个子序列,通过所述第一大语言模型对各个所述子序列进行分批处理,得到每个所述子序列对应的理解结果;对多个所述理解结果进行融合处理,得到所述待处理视频对应的目标理解结果。通过本发明的方法,有效减小了大语言模型的上下文长度对视频理解的限制,大大增加了能够处理的视频的时长。
-
公开(公告)号:CN119007134A
公开(公告)日:2024-11-22
申请号:CN202411002934.9
申请日:2024-07-25
Applicant: 北京卓视智通科技有限责任公司
Abstract: 本发明公开了一种路面遗撒物检测方法、系统、设备及介质,涉及图像处理技术领域,方法包括:基于针对待检测区域采集到的检测图像,确定包含疑似遗撒物目标的第一目标列表以及确定包含遗撒物目标的第二目标列表;将第一目标列表与第二目标列表中重叠部分从第一目标列表中去除,并将剩余目标与第二目标列表中的遗撒物目标合并生成检测图像的道路遗撒物目标列表;确定道路遗撒物目标列表中每个目标对应的目标轨迹,并将满足预设条件的目标轨迹进行误检判定,将判定结果为非误检的目标轨迹对应的目标作为遗撒物检测结果进行输出。本发明在第一目标列表以及第二目标列表的基础上,进行误检判定,提升了本方案在道路遗撒物的确定过程中的准确率。
-
公开(公告)号:CN117690120B
公开(公告)日:2024-10-29
申请号:CN202311728530.3
申请日:2023-12-15
Applicant: 北京卓视智通科技有限责任公司
IPC: G06V20/62 , G06V20/54 , G06V30/16 , G06T5/73 , G06V30/148 , G06V30/162 , G06V30/19 , G08G1/054
Abstract: 本发明涉及智能交通物联网应用服务技术领域,具体涉及一种移动设备抓拍车牌的车辆监控方法及系统。该方法通过物联网设备获取车牌图像,根据车牌图像中的梯度信息获取每个像素点的局部清晰度。根据像素点之间邻域范围内的像素值变化趋势的差异程度筛选出修正像素点,并对像素点的局部清晰度进行修正,获得车牌图像准确的整体清晰度。进而筛选出最优车牌图像并提取车牌信息。本发明通过对移动设备采集的图像进行分析处理,获得准确的车牌信息,提高了智能交通物联网应用服务的服务效率和服务能力。
-
公开(公告)号:CN118840697A
公开(公告)日:2024-10-25
申请号:CN202411310740.5
申请日:2024-09-20
Applicant: 北京卓视智通科技有限责任公司
IPC: G06V20/40 , G06N20/00 , G06V10/77 , H04N21/845
Abstract: 本发明涉及一种基于大模型的长视频理解方法、装置、设备及介质,该方法包括:获取待处理视频;对所述待处理视频进行秒级抽帧,得到初步视频帧序列;根据所述初步视频帧序列的长度、第一大语言模型的上下文长度和第一设定长度,对所述初步视频帧序列进行划分,得到至少一个子序列,通过所述第一大语言模型对各个所述子序列进行分批处理,得到每个所述子序列对应的理解结果;对多个所述理解结果进行融合处理,得到所述待处理视频对应的目标理解结果。通过本发明的方法,有效减小了大语言模型的上下文长度对视频理解的限制,大大增加了能够处理的视频的时长。
-
公开(公告)号:CN118645013A
公开(公告)日:2024-09-13
申请号:CN202410681043.4
申请日:2024-05-29
Applicant: 北京卓视智通科技有限责任公司
Abstract: 本发明涉及一种高速主动预警系统,包括设置在电子围栏内的处理器,工作人员佩戴的肩灯,以及与所述处理器通讯连接的定位器、报警器和雷达,所述电子围栏为所述高速公路上的封闭车道所形成的区域的外边界,所述肩灯与所述处理器通讯连接,所述肩灯中设置有定位模块,所述定位器的数量为多个,多个所述定位器设置在所述电子围栏周围的边界线上。通过本发明的系统,可以通过报警器和肩灯为将要驶入电子围栏的车辆进行预警,避免发生事故。
-
公开(公告)号:CN117746348B
公开(公告)日:2024-09-10
申请号:CN202311771939.3
申请日:2023-12-21
Applicant: 北京卓视智通科技有限责任公司
IPC: G06V20/54 , G06V10/44 , G06V10/764
Abstract: 本发明涉及一种非法运营车辆的识别方法、装置、电子设备及介质,该方法包括:获取待识别车辆的车辆属性特征集合和目标地域,所述车辆属性特征集合中包括至少一个车辆属性特征;对于每个所述车辆属性特征,根据所述车辆属性特征,确定所述待识别车辆在目标时间下,所述车辆属性特征对应的地域动态变迁特征;根据各个所述车辆属性特征对应的地域动态变迁特征,识别所述待识别车辆的身份识别结果,所述身份识别结果为正常运营车辆或非法运营车辆。通过本发明的方法,可提高待识别车辆的身份识别结果的准确性。
-
-
-
-
-
-
-
-
-