-
公开(公告)号:CN118072082A
公开(公告)日:2024-05-24
申请号:CN202410126969.7
申请日:2024-01-30
Applicant: 上海网达软件股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/77 , G06V10/26 , G06V10/82 , G06N3/045 , G06N3/047 , G06N3/0895 , G06N3/084
Abstract: 本发明涉及人工智能图像视觉算法开发技术领域,尤其涉及一种考虑空间位置的视觉大模型预训练方法,包括:S1:输入大量图像数据,将所述图像数据分割成若干子区块并将所属子区块进行顺序编码来构建自监督标签;S2:将所述子区块打散,并将所述打散的子区块输入VI T模型进行特征提取;S3:在所述所述VI T模型的输出端将每个所述子区块映射到16*16长度的一维向量;S4:对输出的每个所述一维向量输入Softmax函数转成概率分布;S5:将所述自监督标签和所述概率分布输入交叉熵构建训练损失函数。通过设计以图像空间位置联系进行网络监督监督的预训练方式,提取图像通用语义信息,提升下游图像分类、检测精度。
-
公开(公告)号:CN118018667A
公开(公告)日:2024-05-10
申请号:CN202410097066.0
申请日:2024-01-24
Applicant: 上海网达软件股份有限公司
Abstract: 本发明涉及视频监控技术领域,尤其涉及一种用于边缘AI设备人体检测算法的自适应抽帧方法及系统,包括步骤S1、系统启动时,执行初始配置,包括默认的抽帧频率级别及定义触发所述抽帧频率级别调整的触发条件或阈值;步骤S2、在系统运行过程中,根据预设的所述触发条件实时分析监控画面,确定是否需要调整所述抽帧频率级别;步骤S3、根据步骤S2中的实时分析结果,持续监控并自动调整所述所述抽帧频率级别。本发明提出的自适应抽帧方法及系统,通过智能调整抽帧频率,响应监控画面中人体数量、特定事件和时间段变化,使边缘AI设备在进行视频监控时更有效地利用计算资源,降低存储需求,并根据实际监控需求灵活调整从而大幅提升整体性能和运行效率。
-
公开(公告)号:CN117853973A
公开(公告)日:2024-04-09
申请号:CN202311845482.6
申请日:2023-12-28
Applicant: 上海网达软件股份有限公司
IPC: G06V20/40 , G06V20/52 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及图像处理技术领域,尤其涉及一种基于YOLOv5的安全帽检测方法,包括以下步骤:S1:根据安全帽图片建立安全帽数据集,根据YOLOv5的数据格式转化为数据集;S2:训练集根据预训练模型权重通过第一YOLOv5神经网络模型进行训练以得到第一训练模型;S3:测试集根据第一训练模型验证模型效果,调整第一训练参数以得到达到最优性能的第二训练模型,并保留训练模型权重;S4:监控视频输入到第二训练模型进行检测,得到安全帽检测结果和置信度概率。本发明引入了Transformer模块,对全局语义特征提取能力增强;优化特征融合模块为Weighted BiFPN,避免非相邻层特征不能直接交互导致的信息丢失问题,整体增强网络的表征能力;使用带困难样本挖局的损失函数更加鲁棒和具有泛化性。
-
公开(公告)号:CN117853878A
公开(公告)日:2024-04-09
申请号:CN202311816678.2
申请日:2023-12-27
Applicant: 上海网达软件股份有限公司
Abstract: 本发明涉及AI人工智能技术领域,具体地,涉及一种适用于边缘AI设备的检测方法、设备及存储介质。与现有技术相比,本申请提出的技术方案具有如下的有益效果:本发明从模型结构、硬件加速和动态调整策略等多个角度出发,提供了一套综合而创新的技术方案。通过引入NVIDIA‑DALI并行处理,提升预处理速度。推理优化方面使用Triton inference server(模型推理服务器)架构,实现异步多模型推理,通过硬件并行计算,充分发挥GPU硬件平台的性能。此外,本发明提出动态调整输入分辨率和推理精度的方法,以在不同场景下平衡性能和速度。
-
公开(公告)号:CN117768654A
公开(公告)日:2024-03-26
申请号:CN202311733860.1
申请日:2023-12-15
Applicant: 上海网达软件股份有限公司
IPC: H04N19/177 , H04N19/186 , H04N19/154 , H04N19/423
Abstract: 本发明提供了一种基于GPU的智能窄带压缩方法和装置,包括:对输入视频进行解码处理,得到输入视频的YUV帧;复制输入视频的YUV帧,并在达到一个GOP长度时,进行预编码;对预编码后的数据进行解码处理,得到解码后的YUV帧;对比输入视频的YUV帧和解码后的YUV帧,以得到质量评估结果,若质量评估结果高于预设的阈值范围,则降低编码质量参数,直到质量评估结果位于预设的阈值范围内;记录对应编码参数作为最优的编码参数,对输入视频进行编码处理。从而可以在保持较好画质的情况下进行窄带压缩,使输出视频占用带宽或存储更少,且全流程几乎全部运行在GPU加速卡上,仅消耗极少的CPU资源,对运行设备的CPU几乎无要求。
-
公开(公告)号:CN117692669A
公开(公告)日:2024-03-12
申请号:CN202311831178.6
申请日:2023-12-28
Applicant: 上海网达软件股份有限公司
IPC: H04N21/2187 , H04N21/2343 , H04N21/2662 , H04N21/4402 , H04N19/103 , H04N19/159 , H04N19/196 , H04N19/172 , H04N19/154 , H04N19/85
Abstract: 本发明提供了一种直播压缩方法,包括以下步骤:对输入的直播流解封装,将解封装后的当前帧直播数据解码并获取解码后的当前帧解码数据,通过参数重置模块设置当前帧解码数据编码器编码模式与编码参数,对当前帧解码数据进行编码,获取编码后的当前帧编码数据,通过参数预测模块预测当前帧编码数据的最佳编码参数,并将最佳编码参数设置为下一帧解码数据的编码参数,对所述当前帧编码数据进行封装并输出。本发明提供的一种直播压缩方法可实现在高并发路数下视频压缩作业。
-
公开(公告)号:CN117692440A
公开(公告)日:2024-03-12
申请号:CN202311828956.6
申请日:2023-12-28
Applicant: 上海网达软件股份有限公司
IPC: H04L65/1104 , H04L65/65 , H04N5/268 , H04L69/22
Abstract: 本发明涉及监控领域视频传输技术领域,公开了一种监控场景下支持GB28181国标的超级压缩方法,S1:通过一种多媒体通信SIP协议确定摄像头的相关信息,将所述摄像头接入监控平台,用于播放和录制;S2:所述摄像头将RTP数据包推送到流媒体,解析出Video数据包和Audio数据包;S3:将所述Video数据包合并为完整的Video帧,并进行解码处理,生成YUV数据放入解码队列中,进行窄带高清编码;S4:将所述窄带高清编码后的数据与所述Audio数据包重新进行分包处理,并放入到所述流媒体的数据池中,等待转发到其他流媒体和数据录制;S5:释放所述解码器和编码器,进行原有转发流程并释放转码资源。
-
公开(公告)号:CN117668200A
公开(公告)日:2024-03-08
申请号:CN202311829770.2
申请日:2023-12-27
Applicant: 上海网达软件股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F18/213
Abstract: 本发明提供了一种非结构化的图书文本信息检索和汇总方法,包括:对录入的图书进行文本预处理,得到文本信息对应的高维特征投影列表;接收用户输入的问题,并基于用户问题的文本信息提取高维特征投影,形成问题的高维特征投影;确定问题的高维特征投影与高维特征投影列表中文本信息之间的相关性数值;根据相关性数值获取与问题相关的文本信息,并拼接成问题对应的已知信息;根据已知信息构建人工智能提示信息,最后根据人工智能提示信息,通过自然语言处理后,得到用户输入问题所对应的答案。从而一定程度上,可以使用人工智能替代人类翻阅图书(尤其是工具书)快速寻找某个问题的答案,检索效率高,答案相关性强。
-
公开(公告)号:CN117609472A
公开(公告)日:2024-02-27
申请号:CN202311737204.9
申请日:2023-12-15
Applicant: 上海网达软件股份有限公司
IPC: G06F16/332 , G06F18/22 , G06N5/022 , G06F16/22
Abstract: 本发明提供了一种提升知识库长文本问答准确率的方法,包括:对上传知识库的长文本进行预处理后存储到向量数据库中,接收用户向知识库提出的问题,并将问题进行向量化,得到问题向量;从向量数据库中匹配出与问题向量相关的文本向量,并提取相似度大于预设阈值,或者相似度排在前K的文本向量作为匹配结果,其中,K为大于1的自然数;将匹配结果通过大语音模型进行处理,得到问题对应的答案。从而能够更加迅速地从长文本中捕捉到语境信息,减轻模型对长序列的处理负担,提高整体计算效率,并提升长文本问答的准确性。
-
公开(公告)号:CN117579902A
公开(公告)日:2024-02-20
申请号:CN202311537399.2
申请日:2023-11-17
Applicant: 上海网达软件股份有限公司
IPC: H04N21/488 , G06F3/14 , H04L67/1095
Abstract: 本发明公开了一种用于AI边缘智能设备的告警图片屏显方法,每间隔预设时间从摄像头获取图片数据,对图片数据进行分析和识别以判断是否需要告警。若需要告警则将图片数据进行压缩作为告警图片,并与其相对应的报警信息同步保存。调用接口将告警图片的地址信息传送至串口服务。调用QT服务,并调用屏幕驱动以绘制图片,令屏幕切换至绘制图片输出显示。间隔预设时间后屏幕切换回视频流输出显示,并重复上述步骤。通过显示屏显示摄像头的实时画面,支持多画面分屏显示功能。当AI智能边缘设备产生告警时能够显示不同的告警图片,更加直观的了解告警内容。还能够利用屏幕的可视化功能显示硬件资源信息以及告警相关信息,从而给使用者更加多的选择及体验。
-
-
-
-
-
-
-
-
-