一种智能视频监控中行人的检测方法

    公开(公告)号:CN103106414A

    公开(公告)日:2013-05-15

    申请号:CN201210566809.1

    申请日:2012-12-24

    Abstract: 一种智能视频监控中行人的检测方法,涉及计算机视觉、模式识别和图像处理等领域。提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;3)提取输入图片的行人特征描述子;4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;5)对检测的窗口进行融合,获取最终的行人检测结果。

    一种视频监控中的人体行为识别方法

    公开(公告)号:CN103106394A

    公开(公告)日:2013-05-15

    申请号:CN201210566810.4

    申请日:2012-12-24

    CPC classification number: G06K9/00335

    Abstract: 一种视频监控中的人体行为识别方法,涉及计算机视觉领域。提供能够对视频中连续不同的行为进行识别的一种视频监控中的人体行为识别方法。包括检测和表示局部时空特征、计算局部时空特征与类别相关性、计算视频帧与类别相关性、检测和识别人体行为。基于该人体行为识别方法的人体行为监控系统包括视频采集单元、存储单元、特征抽取单元、相关性分析单元、行为识别单元、视频输出单元和预警单元。能够对视频中连续不同的行为进行识别。

    一种基于卷积神经网络模型的暴恐视频检测方法

    公开(公告)号:CN106778590A

    公开(公告)日:2017-05-31

    申请号:CN201611128390.6

    申请日:2016-12-09

    Applicant: 厦门大学

    CPC classification number: G06K9/00718 G06K9/00744 G06K9/4671 G06N3/02

    Abstract: 一种基于卷积神经网络模型的暴恐视频检测方法,涉及计算机视觉和机器学习。包括以下步骤:1)深度神经网络模型的训练;2)在线暴恐视频检测。利用深度学习模型组合低层特征,形成更加抽象的高层表示属性或特征,以发现数据的分布式特征表示。通过该模型能够获取描述能力强的视频图像特征描述子。该特征描述子涵盖了视频图像从低到高各个层次的特征信息,从而大大提高了暴恐视频检测的准确率和召回率。通过少量样本来训练深度卷积网络来获得优秀的检测性能。对恐怖图片检测准确率达99%以上,召回率达98%以上。对于恐怖视频检测准确率达95%,召回率达99%。训练过程无需人工参与,自动根据少量样本生成海量数据。

    一种基于序列保留哈希的超低复杂度图像检索方法

    公开(公告)号:CN106777038A

    公开(公告)日:2017-05-31

    申请号:CN201611127943.6

    申请日:2016-12-09

    Applicant: 厦门大学

    CPC classification number: G06F16/583 G06K9/4604 G06K9/6223

    Abstract: 一种基于序列保留哈希的超低复杂度图像检索方法,涉及图像检索。对于图像库中的图像,随机选取一部分图像作为训练集,并抽取相应的图像特征;采用非线性主成分分析方法将原图像特征降低维度到与哈希编码相同的长度;利用K‑means聚类算法得一系列的支撑点,作为后续哈希函数学习的基础;通过迭代优化学习对应的哈希函数;输出对应的哈希函数并计算整个图像库的哈希编码;对于查询图像,先抽取对应的GIST特征,根据训练得到的哈希编码函数对图像特征进行哈希编码,之后计算查询图像的哈希编码与图像库中的图像特征编码之间的汉明距离,利用汉明距离大小衡量查询图像与图像库中待检索图像之间的相似性,返回相似度高的图像。

    电话声纹门禁系统
    5.
    发明公开

    公开(公告)号:CN102306412A

    公开(公告)日:2012-01-04

    申请号:CN201110243163.9

    申请日:2011-08-23

    Applicant: 厦门大学

    Abstract: 电话声纹门禁系统,涉及一种门禁装置。提供一种容易鉴别冒充者身份,通过电话可实现门禁的自动声纹验证的电话声纹门禁系统。设有主控服务器、电话交换机、声纹门禁控制器、网络交换机或者集线器、管理机、总线、电话线、直通双绞线和数据中继线;电话交换机通过数据中继线与主控服务器连接,电话交换机通过电话线与声纹门禁控制器连接,声纹门禁控制器通过直通双绞线与网络交换机或者集线器连接,网络交换机或者集线器通过总线分别与主控服务器和管理机连接。

    一种基于任务扩增的迁移攻击方法

    公开(公告)号:CN114444690B

    公开(公告)日:2024-06-07

    申请号:CN202210100372.6

    申请日:2022-01-27

    Applicant: 厦门大学

    Abstract: 一种基于任务扩增的迁移攻击方法。对于每张干净样本,迭代地生成对应的对抗样本,在每次迭代的过程中,从数据扩增和模型扩增两个方面构造攻击任务,在数据扩增方面,对图片进行随机调整大小和随机填充,在模型扩增方面,通过随机改变模型的部分结构来实现模型扩增,并且为了不影响模型的预测结果,只修改模型的反向传播过程;构造完攻击任务之后,将任务划分为支持集和查询集两个集合,然后根据元学习的核心观念,先在支持集上生成一个暂时的扰动,然后再在查询集上对这个暂时的扰动进行微调,最终的扰动更新由支持集和查询集上的梯度共同决定。能够让对抗扰动在所构造的任务上充分泛化,不会对单一的图像模式或单一的模型过拟合。

    一种基于虚拟增强的人-物交互检测方法

    公开(公告)号:CN117115695A

    公开(公告)日:2023-11-24

    申请号:CN202311121543.4

    申请日:2023-09-01

    Applicant: 厦门大学

    Abstract: 一种基于虚拟增强的人‑物交互检测方法,涉及人物交互检测领域。根据物体及动作类别生成自然文本描述,利用文本到图像生成模型生成对应虚拟图像数据。为了消除图像生成过程中的不确定性和不稳定性,通过优化文本描述提高图像数据生成质量和多样性,通过场景评估过滤分布外数据,通过检测与语义验证确保图像内容的正确性。为了进一步提升图像标注信息的利用,采用教师‑学生框架,在原始数据训练的基础上利用教师模型为虚拟数据生成伪标签,根据自适应二分匹配的方式解决标签质量问题,再利用高置信筛选的方式补充额外的标签信息。解决人‑物交互检测中存在的类别偏置问题。在人物交互数据集上,可以以后处理的方式提高现有模型的预测准确性。

    一种基于自相似性的双分支特征融合的伪装目标检测方法

    公开(公告)号:CN116129152A

    公开(公告)日:2023-05-16

    申请号:CN202310170387.4

    申请日:2023-02-27

    Applicant: 厦门大学

    Abstract: 一种基于自相似性的双分支特征融合的伪装目标检测方法,涉及多角度特征融合、自相似性约束及特征优化。针对于普遍利用先搜索再识别的不同网络框架无法更有效定位前背景更精细区别的问题,1)使用backbone提取低级、中级以及高级特征;2)针对中高层特征采用双分支特征融合的方式获取增强后的特征;3)通过特征优化继续得到最终精细的预测图;4)对于增强后的特征根据groundtruth分别找到映射后的前背景区域,计算各自自相似性矩阵,对于精细特征直接利用groudtruth进行全局自相似性约束,最后计算粗预测图、精细预测图与自相似性三大部分损失。突出前背景之间更精细的区别,降低模型检测平均绝对误差。

    一种基于改进型LeNet的鲁棒蒙面人脸检测方法

    公开(公告)号:CN106778589A

    公开(公告)日:2017-05-31

    申请号:CN201611127956.3

    申请日:2016-12-09

    Applicant: 厦门大学

    Abstract: 一种基于改进型LeNet的鲁棒蒙面人脸检测方法,涉及蒙面人脸检测。包括以下步骤:1)通过水平翻转原始训练图片,扩充训练数据;2)通过修改传统的LeNet模型的结构,提出新的MLeNet模型,使之适应于蒙面人类的检测问题,具体方法可为:调整卷积核大小和特征图个数,另外,改变原来的输出层的节点数10为2,使之适合于人类检测的2分类问题;3)借用原始的LeNet模型中的参数预训练MLeNet结构,并微调MLeNet模型,得到适合于蒙面人脸的检测器;4)结合滑动窗口及非最大化抑制技术准确定位出蒙面人人脸的位置。能够准确的检测出蒙面人人脸,且在背景散乱,环境变化等干扰条件下,该模型依然有较强的鲁棒性。

    一种基于AIGC图像生成的医疗数据集构建方法

    公开(公告)号:CN119889596A

    公开(公告)日:2025-04-25

    申请号:CN202510381402.9

    申请日:2025-03-28

    Applicant: 厦门大学

    Inventor: 蔡成茂 林贤明

    Abstract: 本发明公开了一种基于AIGC图像生成的医疗数据集构建方法,属于图像生成模型技术领域,具体包括:构建医疗领域语义约束矩阵,生成结构化prompt模板库,利用LORA微调将真实医疗图像与结构化prompt输入扩散模型,建立映射关系生成数据,对生成数据验证解剖结构合理性,通过循环修正使器官形态学参数符合医学先验知识,依目标病灶特征生成不同尺度变体,形成三维连续参数空间,按动态权重混合真实与生成数据,使用分层特征对齐算法优化扩散模型表征空间,提取共享特征基底层用于预训练,在训练后期提高真实数据权重,监测训练过程特征响应模式,指标不符标准时实时生成同类型评估数据集测试,直至达标。

Patent Agency Ranking