一种基于零样本学习的视频动作识别方法

    公开(公告)号:CN114842398B

    公开(公告)日:2024-12-17

    申请号:CN202210563048.8

    申请日:2022-05-23

    Inventor: 肖波 王博 赵凯莉

    Abstract: 本发明公开了一种基于零样本学习的视频动作识别方法,提出了一个新的实例级别的视频属性作为语义特征,该语义特征利用了视频的空间信息与时序信息,能够为视频提供更加精确的语义描述,从而更好地连接可见类别与不可见类别,在不可见类别上能够取得更高的识别准确率。同时,为了更好地优化视觉‑语义联合空间,本发明设计了一个新的对比损失函数——视觉‑实例级别的视频属性对比损失函数。该对比损失函数既考虑了不同视频个体视觉表征与语义表征之间的关系,又考虑了不同类别视频视觉表征之间的关系,使得视觉‑语义联合空间具有更好的对齐性与均匀性,这两个特性使得训练好的模型在不可见类别上的性能更优。

    图像的分割方法、装置、电子设备及介质

    公开(公告)号:CN115439846B

    公开(公告)日:2023-04-25

    申请号:CN202210952173.8

    申请日:2022-08-09

    Abstract: 本申请公开了一种图像的分割方法、装置、电子设备及介质。通过应用本申请的技术方案,可以利用原始图像的类激活图像来确定其每个特征区域图像的所属类别,并将其中特定类别的特征区域图像映射到原始图像中从而得到保留有分割对象的完整边界的分割图像。进而实现一种利用超像素技术保留目标区域的边界,并同时结合采用计算目标区域原型的方法尽可能获得图像完整的伪像素级标签。从而避免了相关技术中存在的,由于类激活图存在产生的伪像素级标签目标区域不完成或边界不明显所导致的,分割后的图像不够精确的问题。

    一种用于单标签图像检索的标签表征构建方法

    公开(公告)号:CN115964527A

    公开(公告)日:2023-04-14

    申请号:CN202310011361.5

    申请日:2023-01-05

    Abstract: 本发明提供了一种用于单标签图像检索的标签表征构建方法,包括:基于全连接神经网络确定单标签图像的标签表征,并基于标签表征平衡损失以及量化损失反向优化全连接神经网络;基于卷积神经网络提取单标签图像的图像特征,并与对应的标签表征之间的中心相似性损失来优化卷积神经网络;基于卷积神经网络提取待检索单标签图像特征,并符号化为二进制码,并基于二进制码实现对单标签图像的检索。通过确定单标签图像的单标签信息,同时,通过全连接神经网络生成各个标签的表征向量,并鼓励标签表征相互之间保持最大的距离,从而增加标签表征之间的可辨别性,将标签表征作为所有同标签图像特征的类中心,为图像特征学习提供了极大便利。

    图像的分割方法、装置、电子设备及介质

    公开(公告)号:CN115439846A

    公开(公告)日:2022-12-06

    申请号:CN202210952173.8

    申请日:2022-08-09

    Abstract: 本申请公开了一种图像的分割方法、装置、电子设备及介质。通过应用本申请的技术方案,可以利用原始图像的类激活图像来确定其每个特征区域图像的所属类别,并将其中特定类别的特征区域图像映射到原始图像中从而得到保留有分割对象的完整边界的分割图像。进而实现一种利用超像素技术保留目标区域的边界,并同时结合采用计算目标区域原型的方法尽可能获得图像完整的伪像素级标签。从而避免了相关技术中存在的,由于类激活图存在产生的伪像素级标签目标区域不完成或边界不明显所导致的,分割后的图像不够精确的问题。

    一种基于零样本学习的视频动作识别方法

    公开(公告)号:CN114842398A

    公开(公告)日:2022-08-02

    申请号:CN202210563048.8

    申请日:2022-05-23

    Inventor: 肖波 王博 赵凯莉

    Abstract: 本发明公开了一种基于零样本学习的视频动作识别方法,提出了一个新的实例级别的视频属性作为语义特征,该语义特征利用了视频的空间信息与时序信息,能够为视频提供更加精确的语义描述,从而更好地连接可见类别与不可见类别,在不可见类别上能够取得更高的识别准确率。同时,为了更好地优化视觉‑语义联合空间,本发明设计了一个新的对比损失函数——视觉‑实例级别的视频属性对比损失函数。该对比损失函数既考虑了不同视频个体视觉表征与语义表征之间的关系,又考虑了不同类别视频视觉表征之间的关系,使得视觉‑语义联合空间具有更好的对齐性与均匀性,这两个特性使得训练好的模型在不可见类别上的性能更优。

    一种基于视频描述的视频场景分类方法

    公开(公告)号:CN109948721B

    公开(公告)日:2021-07-09

    申请号:CN201910238135.4

    申请日:2019-03-27

    Inventor: 黄麟 肖波 马占宇

    Abstract: 本发明公开了一种基于视频描述的视频场景分类方法,包括:基于DCT变换以及帧滑动窗口快速提取视频关键帧,并对视频关键帧进行划分;采用3d卷积神经网络对视频不定长关键帧序列进行特征提取;通过Sent2Vec方式获取每个视频描述的嵌入表示作为视频的语义表示;基于提取的特征和语义表示得到最终模型架构三维卷积循环神经网络。本发明借助于视频描述,实现一种快速、准确的视频场景分类方法,该方法可快速准确地提取视频关键帧,相比使用视频所有的帧或者按照一定时间间隔抽样,结果更加准确快速。同时可提升视频场景分类的准确性,通过长短期记忆神经网络训练学习视频的关键帧时序关系,更符合视频这一流媒体的性质。可处理任意长度视频关键帧序列。

    基于度量学习的深度哈希方法

    公开(公告)号:CN111611413A

    公开(公告)日:2020-09-01

    申请号:CN202010453613.6

    申请日:2020-05-26

    Abstract: 基于度量学习的深度哈希方法,涉及计算机视觉和图像处理领域,解决现有深度哈希方法的对比损失函数只能使得相同类别的图像在量化前的特征向量尽可能接近,但并不能鼓励其符号相同;使不同类别图像的量化前的值尽可能远离,但并不能鼓励其符号相反;最终导致量化后的哈希码鉴别力差,造成误判等问题,本发明构建哈希对比损失函数,对于量化前的实数值特征向量进行符号位的约束,使得量化前的实数值特征向量在经过符号函数量化后,得到的代表图像的哈希编码更加的准确,通过fsim(fi·fj)和fdiff(fi·fj)两个控制函数,对符号进行约束;表达式中其他部分用于使相同类别图像的特征值接近,不同类别图像特征值远离。本发明方法有效的提高分类的精度,减少了误判率。

    一种终端鉴权与进程管理系统及其控制方法

    公开(公告)号:CN111506476A

    公开(公告)日:2020-08-07

    申请号:CN202010297350.4

    申请日:2020-04-15

    Abstract: 本发明一种终端鉴权与进程管理系统及其控制方法,包括:鉴权模块以及进程监控模块;通过鉴权模块创建针对用户的登陆日志,建立动态监听指针实时更新用户的鉴权状态;通过服务端远程的命令下发,修改相应用户的使用权限;采用进程监控模块下发限制进程命令完成构建;通过两部分模块对管理用户终端群的鉴权、进程情况进行实时控制,对检测逻辑以及处理逻辑终端的进程运行状态进行限制,针对每个终端实施不同命令下的调整,使用嵌入进程的线程探针,当进程执行,则探针也随之执行并将进程信息发送给处理模块;这样的操作设计,降低了查找相应进程的时间,节省了信息存储空间。

Patent Agency Ranking