一种基于时空双分支网络的视频对象检测与分割方法

    公开(公告)号:CN110097568B

    公开(公告)日:2023-06-09

    申请号:CN201910391883.6

    申请日:2019-05-13

    Abstract: 本发明公开了一种基于时空双分支网络的视频对象检测与分割方法,该方法包含:以视频作为数据输入,通过视频序列预处理将其分成多张连续的RGB图像,输入到空间分支网络对相对较少的像素标记前景掩码进行微调以生成对象分割图像信息;然后进入时空联合网络训练的目标检测器进行边界重叠度评分,将所有重叠度大于阈值的候选边界框都输入到目标分类器中以检测目标的类别,输出目标类别的评分;通过目标过滤器精细修正对象的边界以进行分割,最后输出对象在图像中的坐标信息和相应的目标类别,实现了复杂场景下的视频对象检测与分割。本发明的方法能够应用于干扰目标繁多和极其复杂的实际场景中,提高了复杂场景下目标对象检测和分割的准确性。

    一种实时推荐无冲突停车位的深度强化学习方法

    公开(公告)号:CN115830869A

    公开(公告)日:2023-03-21

    申请号:CN202211503162.8

    申请日:2022-11-28

    Abstract: 本发明公开了一种实时推荐无冲突停车位的深度强化学习方法,该方法包括如下步骤:将实时收集的空置停车位置数据作为停车感知数据,输入在VCS服务器上搭建的强化学习PPO模型中,通过特征网络进行特征提取,预测车辆的社交环境;然后经过策略网络得到车辆相应的策略概率分布,并利用价值网络计算V值,进而对两个网络进行更新直至收敛;在此过程中,VCS服务器会计算车辆停车感知状态的奖励并利用预测得出的车辆下一状态为车辆提供合适的停车策略;此外,本发明考虑了真实情况,利用博弈规则为车辆提供备选方案,解决了真实场景下因车辆增加,交通拥堵导致的寻找停车位困难以及停车位冲突的问题。

    一种基于docker和jupyter notebook的复合类型题目在线检测方法

    公开(公告)号:CN115145805A

    公开(公告)日:2022-10-04

    申请号:CN202110348404.X

    申请日:2021-03-31

    Abstract: 本发明公开了一种基于docker和jupyter notebook的复合类型题目在线检测方法,该方法包含:教师使用jupyter notebook出题,并编写配套的测试用例,将二者整合到docker容器中发布到在线平台;学生在线答题,更新ipynb文件;读取ipynb文件中的用户源码以及对应的测试用例;初始化评测环境;遍历每道题目,选择对应评测方法(图片判断、常规判断、文件判断、自定义判断);分析结果,得出分数。本发明在docker和jupyter notebook的环境需求下,实现了在线评测的功能,并提供了评测多种类型题目的方法。

    一种软包装印刷质量缺陷检测方法

    公开(公告)号:CN115078365A

    公开(公告)日:2022-09-20

    申请号:CN202110276004.2

    申请日:2021-03-15

    Abstract: 本发明公开了一种软包装印刷质量缺陷检测方法,该方法包含:将待检测图像分为三个部分,前景,背景以及条码区域,分别进行处理。前景区域采用模板匹配,找到对应区域,进行像素级的对比;通过模板匹配,找到对应条码区域,采用均值滤波的方法去除颜色过渡的影响,进行条形码区域的检测;除去已经检测过的前景和条码区域,背景区域采用异常点检测的方法,来检测小气泡等缺陷,从而实现了复杂图像软包装的印刷质量缺陷检测。本发明能够检测出多种软包装的印刷缺陷,并提高了软包装印刷质量缺陷检测的精确程度。

    一种复杂场景下的实时在线行人分析与计数系统及方法

    公开(公告)号:CN110147743B

    公开(公告)日:2021-08-06

    申请号:CN201910381879.1

    申请日:2019-05-08

    Abstract: 本发明提供一种复杂场景下的实时在线行人分析与计数系统及方法,其中方法为以视频信息作为输入,通过数据预处理将视频数据转换为连续的RGB帧图像,利用原始的SSD网络进行人员目标检测;然后,将生成的多个建议框输入到两个并行的分支网络中用于人体关键点检测,一个为堆叠沙漏网络,用于位置修正和优化目标检测生成的建议框结果;另一个为姿态卷积机。本发明通过对特定的复杂场景进行分析并建立了一套完整的解决方案和框架,利用人体关键点这一高级特征将多个领域的算法进行有机的整合,能够解决实际工程场景下的人员的目标检测与跟踪、人体关键点分析、人体动作识别和计数分析等问题,具有广泛的应用场景。

    基于深度学习的人体数据批量测量系统

    公开(公告)号:CN112353033A

    公开(公告)日:2021-02-12

    申请号:CN202010947520.9

    申请日:2020-09-10

    Abstract: 基于深度学习的人体数据批量测量系统。本发明设计了一种自动识别、测量、计算得出制作服装所需人体关键数据的系统。系统使用人脸识别技术识别出视频中的待测者,然后使用人体姿态识别的方法从视频中识别出正视图和侧视图并使用深度学习的方法提取出人体轮廓,通过对人体轮廓进行划分来提取出人体的二十个关键特征点。最终将关键点之间的位置差信息与像素比例结合计算得出最终的人体关键数据。相较于已有方法,本发明设计的系统具有简便、批量性、准确度高等优点。

    一种基于复杂场景下的人体关键点检测系统及方法

    公开(公告)号:CN108710868B

    公开(公告)日:2020-09-04

    申请号:CN201810582712.7

    申请日:2018-06-05

    Abstract: 本发明公开了一种基于复杂场景下的人体关键点检测系统及方法,该方法包含:输入监控视频信息,得到单帧静态图和多帧光流图;对单帧静态图通过卷积操作提取特征以得到特征图,为解决复杂场景下干扰目标对人员目标检测的影响,采用人员目标检测算法,以对特征图的实际置信度与预设置信度进行判别,得到离散化人员目标包围盒;对多帧光流图采用光流堆叠来形成二维矢量场;提取离散化人员目标包围盒中特征,得到特征图,获得部位的关键点和关联程度,利用预测器为人体每个部位生成部位置信图,通过部位置信图和二维矢量场实现人体关键点的精准检测。本发明的系统及方法用于复杂场景下的人体关键点检测,实现人员目标关键点的精准检测。

    一种基于复杂场景下的人体关键点检测系统及方法

    公开(公告)号:CN108710868A

    公开(公告)日:2018-10-26

    申请号:CN201810582712.7

    申请日:2018-06-05

    Abstract: 本发明公开了一种基于复杂场景下的人体关键点检测系统及方法,该方法包含:输入监控视频信息,得到单帧静态图和多帧光流图;对单帧静态图通过卷积操作提取特征以得到特征图,为解决复杂场景下干扰目标对人员目标检测的影响,采用人员目标检测算法,以对特征图的实际置信度与预设置信度进行判别,得到离散化人员目标包围盒;对多帧光流图采用光流堆叠来形成二维矢量场;提取离散化人员目标包围盒中特征,得到特征图,获得部位的关键点和关联程度,利用预测器为人体每个部位生成部位置信图,通过部位置信图和二维矢量场实现人体关键点的精准检测。本发明的系统及方法用于复杂场景下的人体关键点检测,实现人员目标关键点的精准检测。

    一种实时推荐无冲突停车位的深度强化学习方法

    公开(公告)号:CN115830869B

    公开(公告)日:2024-12-20

    申请号:CN202211503162.8

    申请日:2022-11-28

    Abstract: 本发明公开了一种实时推荐无冲突停车位的深度强化学习方法,该方法包括如下步骤:将实时收集的空置停车位置数据作为停车感知数据,输入在VCS服务器上搭建的强化学习PPO模型中,通过特征网络进行特征提取,预测车辆的社交环境;然后经过策略网络得到车辆相应的策略概率分布,并利用价值网络计算V值,进而对两个网络进行更新直至收敛;在此过程中,VCS服务器会计算车辆停车感知状态的奖励并利用预测得出的车辆下一状态为车辆提供合适的停车策略;此外,本发明考虑了真实情况,利用博弈规则为车辆提供备选方案,解决了真实场景下因车辆增加,交通拥堵导致的寻找停车位困难以及停车位冲突的问题。

    一种风格可控的图像文本实时翻译与转换方法

    公开(公告)号:CN111723585B

    公开(公告)日:2023-11-28

    申请号:CN202010512502.8

    申请日:2020-06-08

    Abstract: 本发明公开了一种风格可控的图像文本实时翻译与转换方法,该方法包含:将场景图像作为输入;利用多层CNN网络进行特征提取,检测出图像文本的位置与形态信息。然后基于文本定位框擦除文本像素得到背景图像和掩膜,利用粗细两层基于编解码器结构的修复网络进行背景图像修复。同时将图像文本进行形态纠正与去风格化,得到普通字体图像文本;使用CRNN模型将图像文本进行识别,结合文本语义进行修正,按照需求进行翻译或转换。通过学习原文本的艺术风格对翻译文本进行风格化处理;输出文本转换风格可控的场景图像。本发明的方法能够从场景图像中解析出更多有价值的信息,显著增强了图像文本翻译转换时的信息保存程度。

Patent Agency Ranking