-
公开(公告)号:CN1142518C
公开(公告)日:2004-03-17
申请号:CN02132598.7
申请日:2002-07-12
CPC classification number: G06T1/005 , G06T2201/0052
Abstract: 数字水印嵌入媒体信息和从媒体信息中析出可复原水印信息的方法,它属于模式识别领域。首先是对媒体信息进行二层小波变换,在H2L2和L2H2系数区域分别嵌入水印信息和跟踪阵信息,逆小波变换恢复原媒体信息。当媒体信息被处理、攻击后,先对媒体信息进行小波变换,提取跟踪阵,计算跟踪阵和原始跟踪阵内容的相似度,恢复媒体信息,根据跟踪阵相似度确定媒体信息经历的各种攻击、处理的方法和程度,提供了一个还原媒体信息的依据和参照,最后再还原得出媒体信息中有效的水印信息。本发明中的媒体信息如受到干扰和处理后,提取的水印也较清晰,这对于媒体等信息的被盗版、被非法拷贝具有很好的判断作用。
-
公开(公告)号:CN1389825A
公开(公告)日:2003-01-08
申请号:CN02132598.7
申请日:2002-07-12
CPC classification number: G06T1/005 , G06T2201/0052
Abstract: 数字水印嵌入媒体信息和从媒体信息中析出可复原水印信息的方法,它属于模式识别领域。首先是对媒体信息进行二层小波变换,在H2L2和L2H2系数区域分别嵌入水印信息和跟踪阵信息,逆小波变换恢复原媒体信息。当媒体信息被处理、攻击后,先对媒体信息进行小波变换,提取跟踪阵,计算跟踪阵和原始跟踪阵内容的相似度,恢复媒体信息,根据跟踪阵相似度确定媒体信息经历的各种攻击、处理的方法和程度,提供了一个还原媒体信息的依据和参照,最后再还原得出媒体信息中有效的水印信息。本发明中的媒体信息如受到干扰和处理后,提取的水印也较清晰,这对于媒体等信息的被盗版、被非法拷贝具有很好的判断作用。
-
公开(公告)号:CN118800282A
公开(公告)日:2024-10-18
申请号:CN202411273679.1
申请日:2024-09-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 一种自适应多频段语音混合情感感知方法,输入语音信号经过预处理分帧,利用快速傅里叶变换获取频谱特征,信号通过梅尔尺度的三角滤波器组处理,模拟人类听觉系统的非线性频率特性,并通过离散余弦变换提取关键频率信息的梅尔频谱系数。根据语音共振峰F1、F2、F3进行频段划分,定制化特征提取策略。自适应深度残差块并行处理各频段特征,深度控制器动态调整网络深度以适应信号复杂度。ADRB中,多层蒸馏和残差通道实现多级特征提取,残差连接优化特征融合。混合区域注意力机制结合全局和局部注意力,强化频段间依赖关系。时间驱动模块加强时序连续性,最终特征融合用于情感分类和识别。该方法全面捕捉情感特征,显著提升情感状态识别的精度和效率。
-
公开(公告)号:CN118800282B
公开(公告)日:2024-11-29
申请号:CN202411273679.1
申请日:2024-09-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 一种自适应多频段语音混合情感感知方法,输入语音信号经过预处理分帧,利用快速傅里叶变换获取频谱特征,信号通过梅尔尺度的三角滤波器组处理,模拟人类听觉系统的非线性频率特性,并通过离散余弦变换提取关键频率信息的梅尔频谱系数。根据语音共振峰F1、F2、F3进行频段划分,定制化特征提取策略。自适应深度残差块并行处理各频段特征,深度控制器动态调整网络深度以适应信号复杂度。ADRB中,多层蒸馏和残差通道实现多级特征提取,残差连接优化特征融合。混合区域注意力机制结合全局和局部注意力,强化频段间依赖关系。时间驱动模块加强时序连续性,最终特征融合用于情感分类和识别。该方法全面捕捉情感特征,显著提升情感状态识别的精度和效率。
-
公开(公告)号:CN118800218A
公开(公告)日:2024-10-18
申请号:CN202411280779.7
申请日:2024-09-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种基于模态自适应掩码融合网络(MAMF‑Net)的多模态情感识别方法,包括:利用文本编码模型将文本转换为词向量,并通过自注意力机制提取语义结构特征。提取音频上下文特征,并从梅尔频谱图中提取时间依赖特征。通过音频引导式文本编码器融合音频和文本特征,同时采用自掩码机制对迁移信息进行遮挡,捕获模态间的互补信息。使用多头注意力机制综合处理融合后的特征,并通过线性映射层转换为情感类别的概率分布,根据概率分布确定并输出最终的情感分类。本方法通过高效整合模态间信息,在情感识别任务中展现了显著的性能提升,具有广泛的应用潜力。
-
公开(公告)号:CN118800218B
公开(公告)日:2024-12-03
申请号:CN202411280779.7
申请日:2024-09-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种基于模态自适应掩码融合网络(MAMF‑Net)的多模态情感识别方法,包括:利用文本编码模型将文本转换为词向量,并通过自注意力机制提取语义结构特征。提取音频上下文特征,并从梅尔频谱图中提取时间依赖特征。通过音频引导式文本编码器融合音频和文本特征,同时采用自掩码机制对迁移信息进行遮挡,捕获模态间的互补信息。使用多头注意力机制综合处理融合后的特征,并通过线性映射层转换为情感类别的概率分布,根据概率分布确定并输出最终的情感分类。本方法通过高效整合模态间信息,在情感识别任务中展现了显著的性能提升,具有广泛的应用潜力。
-
公开(公告)号:CN117635481A
公开(公告)日:2024-03-01
申请号:CN202311399539.4
申请日:2023-10-26
Applicant: 哈尔滨工业大学
IPC: G06T5/73 , G06T5/60 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 基于深度无关数据集的图像去雾方法、计算机设备、介质和电子设备,属于图像处理技术领域,解决图像去雾处理能力低且无法同时保证去雾效果和计算速度问题。本发明的方法包括:在数据集方面,解耦雾的浓度和场景深度之间的关系,从而生成一个与深度无关的数据集,将雾的浓度和场景深度关系解耦,使图像中雾的浓度与场景完全无关,来引导模型学习雾的浓度来恢复图像;提出了一种全新的卷积跳跃连接,通过为相加的特征融合方法引入一个单独的卷积层,对编码器特征进行卷积,并将卷积后的结果于解码器的特征相加,来提高相加特征融合方法的特征表示能力,进而在几乎不增加计算复杂度的同时提高模型的去雾表现。本发明适用于图像去雾。
-
公开(公告)号:CN117576672A
公开(公告)日:2024-02-20
申请号:CN202311461019.1
申请日:2023-11-06
Applicant: 哈尔滨工业大学
IPC: G06V20/62 , G06V20/70 , G06V10/26 , G06V10/762 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0985
Abstract: 一种学习实例内部语义增强的场景文字检测器和方法,属于场景文本识别技术领域,解决未考虑语义关系以及未考虑边框和中心的一致性而导致检测不准确问题。本发明的检测器包括:文本领域注意力机制TAM和边界融合模块BAG;所述文本领域注意力机制使用连通域分析的方法得到独立的文本区域,使用RoIAlign操作提取RoI特征,然后通过线性层压缩并投影为Troi∈RN×C,其中N是RoI的数量,是C通道数;将Troi和类别令牌Tcls连接起来,添加位置嵌入以形成原始ViT编码器的输入标记;所述边界融合模块根据所述文本领域注意力机制输出的特征图生成高维嵌入的卷积层。本发明适用于自动驾驶、场景文本翻译和场景理解。
-
公开(公告)号:CN113160050A
公开(公告)日:2021-07-23
申请号:CN202110319609.5
申请日:2021-03-25
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于时空神经网络的小目标识别方法及系统,其中,该方法包括:运用超分辨率算法对原始模糊图像进行预处理,得到高画质图像序列;利用时空注意力机制对高画质图像序列的相邻帧间进行逻辑减操作,捕捉并高亮强调可疑区域;提取可疑区域中的深度特征,得到特征图时序序列;采用LSTM状态转移子网将特征图时序序列输入到置信输出的映射装置中,得到转移状态;利用分类器对转移状态进行分类,得到最终识别结果,其中,最终识别结果为目标种类和置信率。该方法随着帧序列的不断读入,模型进行自我修正,逐渐修正为正确的类别并不断提高置信率。
-
公开(公告)号:CN118866315A
公开(公告)日:2024-10-29
申请号:CN202410846644.6
申请日:2024-06-27
Abstract: 本申请提供一种基于动态相位状态的行为表型解码方法和装置,属于图像识别技术领域。采集fMRI信号并进行预处理,将fMRI信号划分为多个皮质感兴趣区域,并将每个皮质感兴趣区域匹配到对应的功能网络上;通过多元变分模态分解将每个脑区的BOLD信号分解成不同频率的子序列,以获取各个脑区的超慢频率的特征子序列;使用希尔伯特变换来计算单个时间点分辨率下的相位差矩阵;使用K均值聚类算法对相位差矩阵进行组水平聚类,识别出短暂且重复出现的大脑动态相位状态,建立动态功能连接矩阵与行为表型的联系并分析重要脑区之间的潜在因果关系。该方案能够更准确地揭示大脑活动与行为特征之间的关联,为认知神经科学研究和神经疾病的临床诊断提供更可靠的依据。
-
-
-
-
-
-
-
-
-