基于深度学习的座位检测与识别系统

    公开(公告)号:CN115565129A

    公开(公告)日:2023-01-03

    申请号:CN202211206051.0

    申请日:2022-09-30

    Abstract: 本发明公开了一种基于深度学习的座位检测与识别系统,包括:图像采集传输模块,用于将摄像头采集到的图像信息传输给服务器,服务器对摄像头采集到的座位的实时视频图像后,截取其中的部分图像帧,经过抗畸变处理之后作为图像特征传递给座位检测模块;座位检测模块,采用预训练的深度学习检测模型对图像特征进行检测并分割出每个座位;座位识别模块,采用预训练的ResNet101网络实时识别每个分割出来的座位的当前状态;用户界面模块,用于可视化地展示当前场景内的座位情况,通过可视化的楼层与区域显示,将接收到的座位识别模块传入的座位信息实时传递给用户。本发明可解决目前图书馆占座现象导致的座位流通差等问题。

    一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法

    公开(公告)号:CN120046656A

    公开(公告)日:2025-05-27

    申请号:CN202510115032.4

    申请日:2025-01-24

    Abstract: 本发明公开了一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法,包括以下步骤:获取多模态问答数据,并将多模态问答数据划分为验证集和测试集;将验证集输入到目标多模态大语言模型中,并通过搜索方法来进行模型各层的冗余度排序;根据冗余度排序,将测试集输入到目标多模态大语言模型中,获取目标多模态大语言模型每一层的冗余度大小;根据冗余度大小,对目标多模态大语言模型的部分层进行关于视觉令牌处理的加速操作。本发明利用视觉令牌所需算力要少于文本令牌的特点,通过定位大语言模型中的冗余层并对其中关于视觉令牌的自注意力操作和前馈神经网络操作进行优化,实现模型推理效率的大幅提升。

    自然场景文本图像字符像素弱监督自动标注方法、系统及介质

    公开(公告)号:CN113673338B

    公开(公告)日:2023-09-26

    申请号:CN202110806669.X

    申请日:2021-07-16

    Abstract: 本发明公开了一种自然场景文本图像字符像素弱监督自动标注方法、系统及介质,该方法包括收集训练样本;生成合成数据;构建并利用训练样本及合成数据训练弱监督实例分割模型;生成伪标注;利用带伪标注数据继续训练;利用已完成训练的弱监督实例分割模型对待标注自然场景文本行图像进行像素级自动标注。本发明能够利用仅带有文本行字符串内容标注的自然场景文本行图像,自动而准确地生成其中每个字符的字符像素标注,从而能够大大解放人力,并可以辅助提升文本行识别器的性能及为场景文本编辑、擦除模型提供细粒度标注信息。此外,本发明鲁棒性强,能够完成各种真实场景环境下复杂结构中英文字符的自动标注。

    自然场景文本图像字符像素弱监督自动标注方法、系统及介质

    公开(公告)号:CN113673338A

    公开(公告)日:2021-11-19

    申请号:CN202110806669.X

    申请日:2021-07-16

    Abstract: 本发明公开了一种自然场景文本图像字符像素弱监督自动标注方法、系统及介质,该方法包括收集训练样本;生成合成数据;构建并利用训练样本及合成数据训练弱监督实例分割模型;生成伪标注;利用带伪标注数据继续训练;利用已完成训练的弱监督实例分割模型对待标注自然场景文本行图像进行像素级自动标注。本发明能够利用仅带有文本行字符串内容标注的自然场景文本行图像,自动而准确地生成其中每个字符的字符像素标注,从而能够大大解放人力,并可以辅助提升文本行识别器的性能及为场景文本编辑、擦除模型提供细粒度标注信息。此外,本发明鲁棒性强,能够完成各种真实场景环境下复杂结构中英文字符的自动标注。

Patent Agency Ranking