-
公开(公告)号:CN118350417B
公开(公告)日:2024-11-19
申请号:CN202410780844.6
申请日:2024-06-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/0455 , G06N3/082 , G06N3/084
Abstract: 本发明公开了一种目标检测模型的优化方法、装置、电子设备及存储介质,应用于DINO模型,涉及人工智能技术领域,所述目标检测模型的优化方法包括以下步骤:S10,LST结构改进:在通过历史任务训练好的原DINO模型上新增旁支网络,以获得新DINO模型;S20,初步预热:固定原DINO模型的网络参数,并利用历史任务对旁支网络的参数进行训练;S30,持续学习增量训练:采用ER技术对新DINO模型进行持续学习训练,且训练过程中采用遗忘性优先采样策略进行历史任务样本选取;S40,推理测试。本发明的有益效果:既能缓解模型的灾难性遗忘,又能快速适应新任务。
-
公开(公告)号:CN118364870A
公开(公告)日:2024-07-19
申请号:CN202410796661.3
申请日:2024-06-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/0455 , G06N3/08 , G06F40/226 , G06F40/284
Abstract: 本发明公开了一种大语言模型的优化方法、装置、电子设备及存储介质,涉及人工智能技术领域,所述大语言模型的优化方法具体包括以下步骤:S10,结合原LLM模型和大模型SFT数据集生成训练数据集;S20,在原LLM模型的主干网络中嵌入旁支网络,以获得新LLM模型,并在旁支网络的输入端输入掩码词元序列;S30,在训练数据集上采用损失函数对新LLM模型进行训练,训练完成后,LLM模型能够在一次推理中预测多个候选词元序列;S40,并行执行候选词元序列的生成和候选词元序列正确性的验证。本发明的有益效果:既节约了资源消耗和时间,又增强了LLM模型的解码能力,还保证了LLM模型输出结果的质量。
-
公开(公告)号:CN118042133A
公开(公告)日:2024-05-14
申请号:CN202410436958.9
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/124 , H04N19/174 , H04N19/132 , G06T9/00
Abstract: 本发明公开一种基于切片表达的全景图像编码方法、解码方法及相关装置,涉及全景图像编解码领域,方法包括以下步骤:对获取的待编码全景图像进行超级切片图像转换,得到超级切片图像集合作为全景图像的切片化表达形式,利用切片编码器对超级切片图像集合进行特征提取,得到超级切片编码,进一步生成超级切片编码量化结果和先验编码量化结果,据此确定高斯分布概率模型,并利用该模型生成超级切片编码量化结果的比特流和先验编码量化结果的比特流;而在解码阶段,对超级切片编码量化结果的比特流进行解码,并将解码结果经过反量化以及切片解码后,得到全景重构图像,提高了全景图像表达的稳定性,实现了高性能的全景图像编解码。
-
公开(公告)号:CN117541512A
公开(公告)日:2024-02-09
申请号:CN202311664982.X
申请日:2023-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T5/77 , G06N3/0464 , G06N3/08
Abstract: 本发明提供基于持续学习的图像恢复模型生成方法及图像恢复方法,涉及图像处理技术领域,方法包括:获取目标退化类型对应的基线模型和训练集,训练集包括第一训练集和第二训练集,第一训练集中的训练数据组少于第二训练集中的训练数据组,每个训练数据组中包括样本待恢复图像以及样本待恢复图像对应的恢复图像;基于第一训练集对目标退化类型对应的基线模型进行训练,得到目标退化类型对应的目标模型;基于目标退化类型对应的目标模型和基线模型确定关键卷积核;基于第二训练集对基线模型进行训练,更新关键卷积核的参数,得到目标退化类型对应的图像恢复模型。本发明可以提高多种图像恢复任务的图像恢复模型的生成效率。
-
公开(公告)号:CN116563840B
公开(公告)日:2023-09-05
申请号:CN202310828211.3
申请日:2023-07-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/62 , G06V20/70 , G06V30/14 , G06V30/18 , G06V10/82 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 本发明提供基于弱监督跨模态对比学习的场景文本检测与识别方法,涉及图像处理技术领域。方法包括:将待识别图像输入至文本识别模型中的第一图像编码器得到第一图像特征图;基于第一图像特征图获取概率特征图、字符位置特征图以及字符语义特征图;基于概率特征图、字符位置特征图和字符语义特征图中确定待识别图像中的文本识别结果;文本识别模型是基于多组包括样本待识别图像以及样本待识别图像对应的第一文本内容标签和文本区域位置标签的第一训练数据训练得到的;文本区域位置标签是基于标签生成模型生成的,标签生成模型基于多组包括样本待标注图像以及样本待标注图像中的第二文本内容标签的第二训练数据训练得到。本发明可以降低标注成本。
-
公开(公告)号:CN114543930B
公开(公告)日:2025-04-25
申请号:CN202210149821.6
申请日:2022-02-18
Applicant: 哈尔滨工业大学(深圳)
IPC: G01F23/04
Abstract: 本申请实施例提供了一种基于图像识别的水位获取方法、装置及电子设备,其中方法包括:通过水尺检测模型识别水尺图像的目标水尺区域;确定目标水尺区域的各相邻两行像素向量之间的像素距离;根据各像素距离中的最大像素距离确定水尺上边界线;将目标水尺区域划分为多个子区域,通过梯度函数计算各子区域的二阶导数,根据各二阶导数确定水尺下边界线;获取目标水尺区域的水尺刻度信息;根据水尺上边界线、水尺下边界线和水尺刻度信息确定水位数据。这样,能够利用水尺刻度信息计算水位数据,不需要预先确定像素坐标与真实坐标对应关系,摄像头安装简单,操作简单、人工成本低,水位数据精度高。
-
公开(公告)号:CN115293964A
公开(公告)日:2022-11-04
申请号:CN202210654312.9
申请日:2022-06-10
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T3/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于可泛化退化表征的超分重建训练数据生成方法。本发明提供的基于可泛化退化表征的超分重建训练数据生成方法,为含有不同退化特性的无标签真实低分辨率学习退化表征,并使用该退化表征作为条件信息输入到退化网络中以生成多种退化特性更加一致的低分图像,从而能够利用退化特性一致的低分图像‑高分图像作为数据对训练超分网络,得到更好的图像超分重建效果。
-
公开(公告)号:CN113886607B
公开(公告)日:2022-07-12
申请号:CN202111199103.1
申请日:2021-10-14
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/41 , G06F16/45 , G06F16/901 , G06F16/906 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于图神经网络的哈希检索方法、装置、终端及存储介质,方法包括:在样本数据集中选取至少一个样本数据;将目标样本数据分别输入至第一特征提取网络和第二特征提取网络,获取目标样本数据的第一特征和第二特征;根据目标样本数据的隐空间编码获取重构特征;根据目标样本数据的隐空间编码以及各个目标样本数据之间的相似性参数构建目标图,通过图神经网络获取目标样本数据的哈希码;根据各个目标样本数据之间的相似性参数、目标样本数据的哈希码、第二特征、第一特征和重构特征对第一特征提取网络的参数和每个隐空间编码进行更新;根据参数收敛后的第一特征提取网络获取待检索数据的哈希码。本发明能够提升哈希检索的性能。
-
公开(公告)号:CN114155873A
公开(公告)日:2022-03-08
申请号:CN202111630541.9
申请日:2021-12-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/0272 , G10L21/0208 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
-
公开(公告)号:CN113160289B
公开(公告)日:2022-02-01
申请号:CN202110345450.4
申请日:2021-03-31
Applicant: 哈尔滨工业大学(深圳) , 深圳富联富桂精密工业有限公司
Abstract: 本发明公开了一种基于深度学习的工业印刷品图像配准方法及装置,具体为根据对应切割规则从模板图像和待配准图像中分别提取尺寸相同的切片,得到一组切片,将一组切片深度融合后得到图像切片对,将所述图像切片对输入配准网络模型中进行训练,得到配准图像切片;将所述配准图像切片舍去边缘部分,然后进行切片对位拼接,得到完整的配准印刷品图像。本发明配准网络模型骨架为类UNet网络,利用空间变换层对不同尺度的特征图进行非刚性配准,配准特征图与解码器中相邻尺度的特征图进行融合,同时相邻尺度配准场也进行融合,综合提升了模型对较大形变印刷品图像的配准能力。本发明能解决当前部分工业纸质印刷品图像配准存在的问题,配准效果好。
-
-
-
-
-
-
-
-
-