一种基于文本辅助的可见光红外行人重识别方法

    公开(公告)号:CN119785384A

    公开(公告)日:2025-04-08

    申请号:CN202411940076.2

    申请日:2024-12-26

    Abstract: 本发明提出了一种基于文本辅助的可见光红外行人重识别方法。所述方法包括:获取待检索红外行人图像和可见光行人图像库,对红外行人图像标注粗略文本描述;对红外行人图像和可见光行人图像进行预处理;构建非对称双分支跨模态特征提取器,引入文本描述作为辅助信息,提取待检索行人图像和图像库所有行人图像的特征;计算两者的余弦相似度,将相似度从高到低排序,生成初始检索序列;计算图像库中行人图像之间的相似度,据此生成近邻集合;计算近邻相似度,据此对初始检索序列进行重排序。本发明通过引入文本描述作为跨模态检索辅助信息,并设计跨模态检索重排序算法,能够很好地解决跨模态行人特征对齐问题,因而获得了较现有方法更准确的行人重识别结果。

    一种融合多模态美学和属性特征的图像美学评估方法

    公开(公告)号:CN119625338A

    公开(公告)日:2025-03-14

    申请号:CN202411684939.4

    申请日:2024-11-22

    Abstract: 本发明提供了一种融合多模态美学和属性特征的图像美学评估方法。所述方法包括:构造图像‑美学以及图像‑属性文本对数据;构建联合属性和美学描述的多模态预训练模型;利用冻结的图像编码器与条件编码器提取原始图像特征与条件特征;利用文本解码器生成匹配条件特征的美学或属性文本;最小化生成文本与目标文本差异得到预训练模型;获取并处理图像和美学评分数据,构建融合多模态美学和属性特征的美学评分模型;提取并融合图像的属性和美学特征得到属性感知的美学特征;将该特征通过线性层映射得到美学分数;利用均方误差函数优化模型参数,得到最终的美学评分模型;本发明不仅能获得能准确的美学评分,而且在推理阶段仅需要单张图像。

    一种目标细胞的智能检测方法

    公开(公告)号:CN113888474A

    公开(公告)日:2022-01-04

    申请号:CN202111063063.8

    申请日:2021-09-10

    Inventor: 赵志诚 苏菲 张琪

    Abstract: 本发明提供了一种目标细胞的智能检测方法。所述方法包括:将超高分辨率免疫组化数字图像均匀地、低重叠地裁剪成多个大尺寸概览图像;将概览图像输入卷积神经网络提取得到不同尺度的特征;将不同尺度的特征进行自适应加权融合,计算出候选细胞的分布概率图;将分布概率图映射到输入的概览图像中,得到多个位置坐标;根据位置坐标信息,对概览图像进行局部裁剪,得到候选细胞的小尺寸近距离图像;将候选细胞的小尺寸近距离图像输入分类网络,输出候选细胞是否为目标细胞的精确分类结果;融合所有概览图像中候选细胞的位置坐标信息和精确分类结果,最后输出目标细胞的检测结果。本发明不仅能更快速地得到检测的结果,还能保证检测的精度。

    一种体温序列职业画像新方法

    公开(公告)号:CN112086202A

    公开(公告)日:2020-12-15

    申请号:CN202010768565.X

    申请日:2020-08-03

    Abstract: 本发明公开了一种体温序列职业画像新方法,属于机器学习领域。首先针对某个目标用户,从体温数据库中提取固定时间段内的体温序列值生成该用户的体温时间序列数据集。如果该体温时间序列数据集有缺失,则对缺失的体温序列值进行补足,生成完整的体温时间序列数据。然后使用完整的体温时间序列数据生成目标用户的五维高层次特征,并将五维高层次特征组成K‑means聚类算法的输入向量,利用K‑means聚类算法得到不同职业的簇。最后对各个职业簇进行数据统计与分析,生成用户职业画像。本发明免去大量繁杂的人工操作,并且进一步挖掘了体温序列的深层次信息,更具表征性。

    基于深度网络的图标检测方法

    公开(公告)号:CN109800698A

    公开(公告)日:2019-05-24

    申请号:CN201910026888.9

    申请日:2019-01-11

    Abstract: 本公开涉及一种基于深度学习的图标检测方法,包括模型训练阶段和模型测试阶段,其中,所述模型训练阶段包括以下步骤:步骤1、准备画面中不含待检测图标的视频帧集合;步骤2、准备仅含有待检测图标的图标图像,其包含颜色通道和Alpha通道数据、以及图标分类信息;步骤3、将所述图标图像与视频帧集合中的各个帧进行随机的图像叠加,形成含有待检测图标的叠加图像,作为训练数据集,训练形成图标检测模型;其中,所述模型测试阶段包括以下步骤:步骤4、将待检测图像输入所述图标检测模型,所述图标检测模型输出检测结果,所述检测结果包括所述测试图像是否含有图标、所含图标的分类信息和位置信息。

    一种基于CNN和LSTM的暴恐视频检测方法

    公开(公告)号:CN105844239B

    公开(公告)日:2019-03-29

    申请号:CN201610168334.9

    申请日:2016-03-23

    Abstract: 本发明公开了一种基于CNN和LSTM的暴恐视频检测方法,属于模式识别、视频检测、深度学习技术领域。所述检测方法首先对待检测视频进行关键帧采样,并提取关键帧特征;然后进行视频层面的表达与判别,包括CNN语义模块的VLAD特征表达与SVM判别、CNN场景模块的场景VLAD特征表达与SVM判别,以及LSTM时序模块的LSTM判别;最后进行结果融合。本发明利用了CNN在图像特征提取和LSTM在时序序列表达方面的优势,并充分考虑暴恐视频在场景方面的特色,实际测试中检测指标mAP值达到98.0%,接近人工作业水准。在运行速度方面,仅采用单机GPU加速的方式,每秒钟便可以处理76.4秒的网络视频,适于阻断暴恐视频在大型视频网站上的传播,有利于维护社会稳定和国家长治久安。

    爆炸电路板残片图像自动比对识别方法

    公开(公告)号:CN106780440A

    公开(公告)日:2017-05-31

    申请号:CN201611075728.6

    申请日:2016-11-29

    CPC classification number: G06T7/0004 G06T2207/30141

    Abstract: 本发明公开了一种爆炸电路板残片图像自动比对识别方法,属于模式识别和图像处理技术领域。所述方法首先将残片图像基于概率图模型的图像分割算法进行对象分割,再采用基于概率抽样的颜色模型进行元器件的对象精定位,然后提取特征点并过滤,将过滤后的特征点与检索库中的电路板特征点进行比对识别,确定残片所属的源电路板。本发明首次提出并实现了根据爆炸电路板残片图像自动识别印刷电路板同型号原板的方法。所述比对识别方法能够准确地分割出电路板中的元器件及字符区域,抑制噪声干扰,比对时同时考虑特征点描述与空间几何关系的相似性,该方法在电路板残片图像自动识别中TOP1准确率高于99%。

    一种多模态行人再辨识技术

    公开(公告)号:CN103942563A

    公开(公告)日:2014-07-23

    申请号:CN201410125981.2

    申请日:2014-03-31

    Abstract: 本申请公开了一种多模态行人再辨识技术,包括以下步骤:步骤1、从第一摄像机和第二摄像机各自拍摄的第一图像和第二图像中分别截取包含目标的前景图像,其中,第二图像对应于已知目标;步骤2、从所截取的前景图像中分别提取颜色特征和纹理特征,并将颜色特征和纹理特征级联,形成图像特征;步骤3、将所述图像特征输入到Hash投影模型,计算第一图像和第二图像中的目标的相似度;步骤4、如果所计算的相似度大于预定阈值,则将第一图像的目标判定为第二图像所对应的已知目标。

    超大型指纹库的索引结构和检索方法

    公开(公告)号:CN101477523B

    公开(公告)日:2011-07-20

    申请号:CN200810180094.X

    申请日:2008-11-24

    Abstract: 本发明用于超大型指纹数据库的指纹检索,提出了超大型指纹库的索引结构和检索方法。本发明属于计算机识别领域,具体涉及到指纹识别、数据库、数据检索和图像处理等领域。本发明提出了一种超大型指纹库检索系统结构的构造方法、基于索引匹配错误概率的索引评价方法、基于分层深度索引的指纹检索方法以及基于一边多次匹配结构特征的检索评价方法来加速超大型指纹库的检索,具有实用价值和普遍的适用性。在离线建库阶段依据基于索引匹配错误概率的索引评价方法对库指纹构建哈希索引、分层深度索引、特征值索引三个功能互补的索引器;在在线检索阶段依据基于索引匹配错误概率的索引评价方法和基于一边多次匹配结构特征的检索评价方法构建检索器。

    一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法

    公开(公告)号:CN119941790A

    公开(公告)日:2025-05-06

    申请号:CN202510001144.7

    申请日:2025-01-02

    Abstract: 本发明提供了一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法。所述方法包括:使用虚幻引擎5构建虚拟仿真世界;构建行人和车辆虚拟多目标跟踪数据;构造文本‑轨迹匹配对生成多模态跟踪数据;构建逐层融合多模态语义特征的多目标跟踪模型;利用文本特征增强感知查询特征;将解码感知特征利用线性层映射到语义空间,并与编码的文本特征计算相似度;利用感知查询结果更新目标轨迹信息;本发明不仅解决了轨迹语义数据集缺失的问题,还通过逐层语义交互模块结合CLIP的跨模态对齐能力,显著提高了模型在复杂动态环境中的语义目标跟踪的准确性和召回率。

Patent Agency Ranking