Patent search ap:("哈尔滨工业大学(威海)" OR "哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)") AND inv:"卢光明" Page 4

31.

发明授权
目标检测模型的优化方法、装置、电子设备及存储介质有权

公开(公告)号：CN118350417B

公开(公告)日：2024-11-19

申请号：CN202410780844.6

申请日：2024-06-18

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 林丰 , 卢光明 , 马骁 , 卢瑶

IPC: G06N3/0455 , G06N3/082 , G06N3/084

Abstract: 本发明公开了一种目标检测模型的优化方法、装置、电子设备及存储介质，应用于DINO模型，涉及人工智能技术领域，所述目标检测模型的优化方法包括以下步骤：S10，LST结构改进：在通过历史任务训练好的原DINO模型上新增旁支网络，以获得新DINO模型；S20，初步预热：固定原DINO模型的网络参数，并利用历史任务对旁支网络的参数进行训练；S30，持续学习增量训练：采用ER技术对新DINO模型进行持续学习训练，且训练过程中采用遗忘性优先采样策略进行历史任务样本选取；S40，推理测试。本发明的有益效果：既能缓解模型的灾难性遗忘，又能快速适应新任务。

32.

发明公开
大语言模型的优化方法、装置、电子设备及存储介质有权

公开(公告)号：CN118364870A

公开(公告)日：2024-07-19

申请号：CN202410796661.3

申请日：2024-06-20

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 林丰 , 卢光明 , 马骁 , 卢瑶

IPC: G06N3/0455 , G06N3/08 , G06F40/226 , G06F40/284

Abstract: 本发明公开了一种大语言模型的优化方法、装置、电子设备及存储介质，涉及人工智能技术领域，所述大语言模型的优化方法具体包括以下步骤：S10，结合原LLM模型和大模型SFT数据集生成训练数据集；S20，在原LLM模型的主干网络中嵌入旁支网络，以获得新LLM模型，并在旁支网络的输入端输入掩码词元序列；S30，在训练数据集上采用损失函数对新LLM模型进行训练，训练完成后，LLM模型能够在一次推理中预测多个候选词元序列；S40，并行执行候选词元序列的生成和候选词元序列正确性的验证。本发明的有益效果：既节约了资源消耗和时间，又增强了LLM模型的解码能力，还保证了LLM模型输出结果的质量。

33.

发明公开
基于切片表达的全景图像编码方法、解码方法及相关装置有权

公开(公告)号：CN118042133A

公开(公告)日：2024-05-14

申请号：CN202410436958.9

申请日：2024-04-12

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 李穆 , 程裕龙 , 李锦兴 , 卢光明

IPC: H04N19/124 , H04N19/174 , H04N19/132 , G06T9/00

Abstract: 本发明公开一种基于切片表达的全景图像编码方法、解码方法及相关装置，涉及全景图像编解码领域，方法包括以下步骤：对获取的待编码全景图像进行超级切片图像转换，得到超级切片图像集合作为全景图像的切片化表达形式，利用切片编码器对超级切片图像集合进行特征提取，得到超级切片编码，进一步生成超级切片编码量化结果和先验编码量化结果，据此确定高斯分布概率模型，并利用该模型生成超级切片编码量化结果的比特流和先验编码量化结果的比特流；而在解码阶段，对超级切片编码量化结果的比特流进行解码，并将解码结果经过反量化以及切片解码后，得到全景重构图像，提高了全景图像表达的稳定性，实现了高性能的全景图像编解码。

34.

发明公开
基于持续学习的图像恢复模型生成方法及图像恢复方法审中-实审

公开(公告)号：CN117541512A

公开(公告)日：2024-02-09

申请号：CN202311664982.X

申请日：2023-12-05

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 陈芳林 , 赵津 , 裴文杰 , 卢光明

IPC: G06T5/77 , G06N3/0464 , G06N3/08

Abstract: 本发明提供基于持续学习的图像恢复模型生成方法及图像恢复方法，涉及图像处理技术领域，方法包括：获取目标退化类型对应的基线模型和训练集，训练集包括第一训练集和第二训练集，第一训练集中的训练数据组少于第二训练集中的训练数据组，每个训练数据组中包括样本待恢复图像以及样本待恢复图像对应的恢复图像；基于第一训练集对目标退化类型对应的基线模型进行训练，得到目标退化类型对应的目标模型；基于目标退化类型对应的目标模型和基线模型确定关键卷积核；基于第二训练集对基线模型进行训练，更新关键卷积核的参数，得到目标退化类型对应的图像恢复模型。本发明可以提高多种图像恢复任务的图像恢复模型的生成效率。

35.

发明授权
基于弱监督跨模态对比学习的场景文本检测与识别方法有权

公开(公告)号：CN116563840B

公开(公告)日：2023-09-05

申请号：CN202310828211.3

申请日：2023-07-07

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 裴文杰 , 伍晶晶 , 房正耀 , 陈芳林 , 卢光明

IPC: G06V20/62 , G06V20/70 , G06V30/14 , G06V30/18 , G06V10/82 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0895

Abstract: 本发明提供基于弱监督跨模态对比学习的场景文本检测与识别方法，涉及图像处理技术领域。方法包括：将待识别图像输入至文本识别模型中的第一图像编码器得到第一图像特征图；基于第一图像特征图获取概率特征图、字符位置特征图以及字符语义特征图；基于概率特征图、字符位置特征图和字符语义特征图中确定待识别图像中的文本识别结果；文本识别模型是基于多组包括样本待识别图像以及样本待识别图像对应的第一文本内容标签和文本区域位置标签的第一训练数据训练得到的；文本区域位置标签是基于标签生成模型生成的，标签生成模型基于多组包括样本待标注图像以及样本待标注图像中的第二文本内容标签的第二训练数据训练得到。本发明可以降低标注成本。

Patent Agency Ranking