-
公开(公告)号:CN115146102A
公开(公告)日:2022-10-04
申请号:CN202210886765.4
申请日:2022-07-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/583 , G06F16/53
Abstract: 本发明公开了基于图像‑文本重要性一致的跨模态检索模型优化方法。本发明提供的方法挖掘了图像‑文本对中的细粒度语义信息,实现了不同模态间更细粒度的对齐,有效提升跨模态检索模型的检索精度。
-
公开(公告)号:CN115293964A
公开(公告)日:2022-11-04
申请号:CN202210654312.9
申请日:2022-06-10
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T3/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于可泛化退化表征的超分重建训练数据生成方法。本发明提供的基于可泛化退化表征的超分重建训练数据生成方法,为含有不同退化特性的无标签真实低分辨率学习退化表征,并使用该退化表征作为条件信息输入到退化网络中以生成多种退化特性更加一致的低分图像,从而能够利用退化特性一致的低分图像‑高分图像作为数据对训练超分网络,得到更好的图像超分重建效果。
-
公开(公告)号:CN114155873A
公开(公告)日:2022-03-08
申请号:CN202111630541.9
申请日:2021-12-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/0272 , G10L21/0208 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
-
公开(公告)号:CN115186810A
公开(公告)日:2022-10-14
申请号:CN202210798777.1
申请日:2022-07-08
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种免训练的神经网络架构搜索方法及相关设备。方法包括:选取至少两个网络输入数据分别输入至目标超网中,获取各个网络输入数据分别对应的网络线性映射输出,其中,目标超网中包括预设数量个节点,相邻的两个节点之间包括至少一个连接,每个连接对应一种神经网络操作;根据各个网络线性映射输出之间的差异确定目标超网的评价值;计算目标超网中每个连接的重要性,其中,目标超网中每一条连接的重要性反映该连接对目标超网的评价值的影响;根据目标超网中各个连接的重要性在目标超网中删除至少一个连接,并重复执行计算目标超网中每个连接的重要性的步骤,直至目标超网为一个单一的神经网络。本发明可以降低神经网络架构搜索的耗时。
-
公开(公告)号:CN115049704A
公开(公告)日:2022-09-13
申请号:CN202210695527.5
申请日:2022-06-20
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T7/246 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/04 , G06T7/11 , G06T7/62 , G06T7/66 , G06T7/73
Abstract: 本发明公开了一种单目标跟踪方法、装置、终端及存储介质,方法包括:将参考图像输入至特征提取网络,获取特征提取网络输出的第一特征图像,将待跟踪图像输入至特征提取网络,获取特征提取网络输出的第二特征图像,其中,参考图像中包括目标标记信息;将第一特征图像输入至编码器,获取编码器输出的中间特征图像;将中间特征图像和第二特征图像输入至解码器,得到解码器的输出数据,根据解码器的输出数据确定待跟踪图像中的目标跟踪结果,其中,解码器中包括了互相关运算。本发明在对待跟踪图像中的目标进行跟踪时,在解码器中结合了互相关运算,实现了更精确的特征融合,减少了背景或者其他信息的干扰。
-
公开(公告)号:CN115049704B
公开(公告)日:2025-04-18
申请号:CN202210695527.5
申请日:2022-06-20
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T7/246 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/045 , G06T7/11 , G06T7/62 , G06T7/66 , G06T7/73
Abstract: 本发明公开了一种单目标跟踪方法、装置、终端及存储介质,方法包括:将参考图像输入至特征提取网络,获取特征提取网络输出的第一特征图像,将待跟踪图像输入至特征提取网络,获取特征提取网络输出的第二特征图像,其中,参考图像中包括目标标记信息;将第一特征图像输入至编码器,获取编码器输出的中间特征图像;将中间特征图像和第二特征图像输入至解码器,得到解码器的输出数据,根据解码器的输出数据确定待跟踪图像中的目标跟踪结果,其中,解码器中包括了互相关运算。本发明在对待跟踪图像中的目标进行跟踪时,在解码器中结合了互相关运算,实现了更精确的特征融合,减少了背景或者其他信息的干扰。
-
公开(公告)号:CN115146102B
公开(公告)日:2025-04-15
申请号:CN202210886765.4
申请日:2022-07-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/583 , G06F16/53
Abstract: 本发明公开了基于图像‑文本重要性一致的跨模态检索模型优化方法。本发明提供的方法挖掘了图像‑文本对中的细粒度语义信息,实现了不同模态间更细粒度的对齐,有效提升跨模态检索模型的检索精度。
-
-
-
-
-
-