-
公开(公告)号:CN114184127B
公开(公告)日:2022-10-25
申请号:CN202111518104.8
申请日:2021-12-13
Applicant: 哈尔滨工业大学
IPC: G01B11/02
Abstract: 一种基于单相机无标靶的建筑物全局位移监测方法,涉及建筑物位移监测技术领域,针对现有技术中需要使用多个监测分机对目标建筑进行多位置位移监测的问题,本申请在监测一个建筑的多个目标点时步骤一到步骤四仅需进行一次,可以达到采集一个角度的视频同时追踪建筑物的多个目标点的效果,并且所述的多个目标点不需要共面,它们可以分布在建筑的任何位置。本申请仅需要一台相机就可以达到通常需要多台相机才能完成的多点同时监测,节省了建筑物位移监测系统的成本。本申请不需要安装人工标靶,仅通过建筑物本身的特征点就可以建立图像像素和建筑物的位移转换关系。
-
公开(公告)号:CN102262731B
公开(公告)日:2012-10-10
申请号:CN201110192198.4
申请日:2011-07-11
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于稀疏编码的字体识别方法。本发明以灰度图像作为输入,对于任意一幅待测试图像进行以下两个阶段的操作:在训练阶段,将各类字体的待测试图像随机划分成一定数量的方块,方块的数量由图像大小以及方块大小共同决定,例如一幅512×512的灰度图像,可以划分成4096个8×8大小的方块。对于任一类字体,以划分出的方块为输入,利用独立成分分析方法训练出一组能够稀疏表示任一方块的基函数,并将这些基函数作为该类字体的模型。本发明可以对中文字体进行识别;也可以对其它语言的字体进行识别;还可以对不同语言的字体进行识别。本发明可以应用在自动文档分析和艺术设计等方面。
-
公开(公告)号:CN101430690A
公开(公告)日:2009-05-13
申请号:CN200810137509.5
申请日:2008-11-12
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6252
Abstract: 基于互训练的流形对图像资源和文字进行融合的方法,涉及图像检索和模式识别技术。它解决了现有的图像检索方法存在的检索精度较差的问题。本发明的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原始流形进行降维处理,得到低维拓扑结构以及相似性度量st(x,y),t的初始值为0;步骤三、对低维拓扑结构进行相似度迭代,得到两幅图像间的相似度;步骤四、根据两幅图像的相似度得到两幅图像样本点之间的收缩率;步骤五、根据步骤四得到的收缩率,对流形进行收缩调整;步骤六、若得到的流形收敛,则融合结束;若得到的流形不收敛,则令t=t+1,并返回执行步骤二。本发明适用于图像处理和图像检索领域。
-
公开(公告)号:CN101425069A
公开(公告)日:2009-05-06
申请号:CN200810137510.8
申请日:2008-11-12
Applicant: 哈尔滨工业大学
Abstract: 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在同一视频镜头内共同出现的频度,来计算视频场景的关联关系G ,并利用视频场景之间的关联关系进行视频快速浏览与检索。本发明不受场景表观上的影响,能够准确的表达两个视频场景之间的物理关联关系,从而解决了传统方法准确率和查全率不高的问题。
-
公开(公告)号:CN1389825A
公开(公告)日:2003-01-08
申请号:CN02132598.7
申请日:2002-07-12
CPC classification number: G06T1/005 , G06T2201/0052
Abstract: 数字水印嵌入媒体信息和从媒体信息中析出可复原水印信息的方法,它属于模式识别领域。首先是对媒体信息进行二层小波变换,在H2L2和L2H2系数区域分别嵌入水印信息和跟踪阵信息,逆小波变换恢复原媒体信息。当媒体信息被处理、攻击后,先对媒体信息进行小波变换,提取跟踪阵,计算跟踪阵和原始跟踪阵内容的相似度,恢复媒体信息,根据跟踪阵相似度确定媒体信息经历的各种攻击、处理的方法和程度,提供了一个还原媒体信息的依据和参照,最后再还原得出媒体信息中有效的水印信息。本发明中的媒体信息如受到干扰和处理后,提取的水印也较清晰,这对于媒体等信息的被盗版、被非法拷贝具有很好的判断作用。
-
公开(公告)号:CN119851017A
公开(公告)日:2025-04-18
申请号:CN202411913875.0
申请日:2024-12-24
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于Mamba与混合专家模型的病理图像分类系统及方法,所述病理图像分类系统提出结合Mamba和专家混合模型的优势,用于WSI分类的挑战性任务,并开发了一种新颖的基于Mamba的层次化网络,称为Mamba‑WSI。为了在保证效率的同时促进特征表示,Mamba‑WSI引入了伪包内和跨伪包的双向Mamba块,以探索伪包内实例之间的相关性和全局伪包表示。同时,本发明提出动态记忆库来存储与标签预测相关的历史信息,并设计了跨伪包融合模块,以从动态更新的字典模块中融合出有效的信息,以增强当前伪包表示和全局建模。此外,专家混合模块能够适应性地协调全局和局部的包表示,以实现鲁棒的包标签预测。
-
公开(公告)号:CN118968579A
公开(公告)日:2024-11-15
申请号:CN202410903224.7
申请日:2024-07-08
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种基于用户提示的音频驱动数字人生成系统及方法,其中系统包括:数据库模块、音频特征提取模块、AIGC生成人脸画像模块、Audioface模块、基于音频驱动的人脸图像模块和基于音频驱动的数字人动作生成模块。本发明实现了基于用户提示的音频驱动数字人生成,根据用户的输入提示实现内容生成,赋予了数字人高度的个性化特征和自然性行为表现,使得本发明具有重要的应用价值和前景,随着相关领域的不断发展和完善,本发明能为数字娱乐、虚拟现实、人机交互等领域带来更加丰富的体验和应用场景。
-
公开(公告)号:CN118799876A
公开(公告)日:2024-10-18
申请号:CN202410771714.6
申请日:2024-06-15
Applicant: 哈尔滨工业大学
IPC: G06V30/148 , G06V30/19 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于多基础大模型的开放词表分割方法,所述方法包括如下步骤:步骤一、建立CLIP和SAM图像特征上的两种交互方式后在全景分割训练集样本上进行训练,得到开放词表分割模型;步骤二、测试阶段采用SAM均匀采样点提示生成的掩码预测对最后的开放词表分割结果进行修正。本发明使用CLIP作为图像编码的主要网络,使用SAM作为辅助模型提供细粒度特征理解能力,通过基础模型特征之间的交互增加开放词表分割模型对生成掩码提案的泛化性,以使预训练的基础模型应用到下游细粒度语义理解和识别任务。本发明将SAM的特征注入Transformer解码器内部和CLIP的特征进行交互和学习,使得掩码查询的结果更加精确。
-
公开(公告)号:CN118657713A
公开(公告)日:2024-09-17
申请号:CN202410669959.8
申请日:2024-05-28
Applicant: 哈尔滨工业大学
IPC: G06T7/00 , G06T7/73 , G06T7/246 , G06V20/40 , G06V10/25 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 插秧机作业质量检测方法及系统,属于图像识别技术领域,尤其涉及插秧机插秧质量的检测;解决了现有秧苗检测方法所存在的秧苗跟踪精度、计数精准度低、计算效率低、不适用于便携嵌入式装置以及实时性差的问题;所述方法包括以下步骤:S6、利用基于三角变换的距离映射算法,将每行秧苗的路径直线中的相邻两个秧苗之间的像素距离转换获得的空间距离作为相邻两个秧苗的株距;S7、根据相邻两个秧苗的株距,获取每个秧苗与其后一个相邻秧苗之间的缺苗数。所述的插秧机作业质量检测方法及系统,适用于插秧机作业质量的实时监测。
-
公开(公告)号:CN102663092B
公开(公告)日:2015-01-28
申请号:CN201210104011.5
申请日:2012-04-11
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于服装组图的风格元素挖掘和推荐方法,包括,用户为推荐系统选择或输入服装样本图像和推荐要求;所述推荐系统对输入服装样本图像进行预处理,建立指定服装组图;所述推荐系统根据推荐要求对指定服装组图中的服装图像进行特定的特征提取;所述推荐系统对服装图像进行特定服装视觉元素的挖掘;根据用于要求和挖掘出的服装视觉元素对数据库中的服装图像进行风格分析,并针对各种服装类型进行评分。本发明通过特征表达和统计分析方法对服装图像的服装视觉元素进行挖掘,进而总结服装图像的设计风格,从而根据服装风格对服装图像进行检索和推荐。本发明能够满足消费者在购买服装时追求的新颖性。
-
-
-
-
-
-
-
-
-