-
公开(公告)号:CN119539013B
公开(公告)日:2025-04-22
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN119540726A
公开(公告)日:2025-02-28
申请号:CN202510104364.2
申请日:2025-01-23
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V10/82 , G06V10/44 , G06V10/50 , G06V10/70 , G06V10/77 , G06V20/13 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/096
Abstract: 本公开的实施例公开了基于上下文增强的遥感基础模型预训练方法和装置。该方法的一具体实施方式包括:获取地面遥感图像集和遥感基础模型;对每个地面遥感图像进行图像块划分以生成图像块向量序列;对每个图像块向量序列进行掩码处理以生成掩码图像块向量序列和原始像素值;将每个掩码图像块向量序列输入遥感基础模型,得到重建像素值集;将每个图像块向量序列输入遥感基础模型,得到预测像素值集;确定遥感基础模型的总损失值,其中,总损失值是重建损失值,预测损失值和一致性损失值的总和;根据总损失值,对遥感基础模型进行反向传播参数更新,得到预训练遥感基础模型。该实施方式可以用来提取准确的遥感特征,减少计算资源的浪费。
-
公开(公告)号:CN114360060B
公开(公告)日:2024-04-09
申请号:CN202111671031.6
申请日:2021-12-31
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V40/20
Abstract: 本发明公开了一种人体动作识别计数方法,包括以下步骤:将人体动作分解为冠状面和矢状面两个平面内的动作,采集人体平面内动作实时视频图像,将所述实时视频图像进行分帧和预处理后,输入人体关键骨骼点检测网络模型,输出每帧图像上的人体关键骨骼点检测结果;将得到的所述人体关键骨骼点检测结果输入预先配置的动作状态特征机,所述动作状态特征机按照所述人体关键骨骼点的置信度约束条件和特征点约束条件,确定用户是否完成对应动作。本发明采用一个通用模型匹配不同动作状态特征机,代码复用率高且计算量小,占用存储空间小,特征表达强,在保证计数准确的同时,具有更快的系统响应速度。
-
公开(公告)号:CN115870237A
公开(公告)日:2023-03-31
申请号:CN202211633258.6
申请日:2022-12-19
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本发明涉及一种流水线产品质量检测并剔除缺陷产品的系统及方法,应用于流水线产品质量检测技术领域,包括:通过相机采集流水线上的图像数据,通过计算图像数据的颜色平均值以及图像特征值判断图像数据中的空心圆柱状产品是否存在缺陷,当有缺陷存在时,通过向设置在流水线一侧的击打装置发送控制信号,击打装置将有缺陷的空心圆柱状产品从流水线上击打到流水线另一侧的地面上,完成对缺陷空心圆柱状产品的剔除,采用本申请的方案,不需要对流水线上的产品的状态有要求,且完成缺陷产品的检测后,可以实时的将空心圆柱状产品从流水线上剔除,无需人工参与,提高了产品质量检测的效率。
-
公开(公告)号:CN114332637B
公开(公告)日:2022-08-30
申请号:CN202210260622.2
申请日:2022-03-17
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请实施例提供了一种遥感影像水体提取方法、遥感影像水体提取的交互方法,其中,遥感影像水体提取方法包括:获取多个第一遥感图像样本,并根据第一遥感图像样本的光谱信息生成第一遥感图像样本对应的第一水体图像;至少根据第一遥感图像样本与对应的第一水体图像对预设的神经网络模型进行训练,以确定神经网络模型的损失函数;其中,损失函数根据全局损失与局部损失确定,局部损失函数由像素级的交叉熵损失以及像素块的对比损失构成;通过神经网络模型对目标遥感图像进行识别,以生成遥感图像对应的目标水体图像;通过本申请实施例,可以解决相关技术中无法针对大区域遥感影像进行准确且高效的水体识别与分割的技术问题。
-
公开(公告)号:CN114444621A
公开(公告)日:2022-05-06
申请号:CN202210370807.9
申请日:2022-04-11
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请涉及基于模板匹配的棋类局面转化方法、装置及存储介质,属于图像识别技术领域。本申请包括:存储棋子的图片构建模板库,读入待转化的棋局局面图片,对模板库中棋子图片以及棋局局面图片进行预处理;将棋局局面图片切割成多个临时图像,使用临时图像遍历所有模板库中的棋子图片,获得临时图像与棋子图片的对比得分,若对比得分大于预设的阈值,则保留至临时匹配结果;过滤掉临时匹配结果中重复的棋子图片得到检测结果,根据检测结果中的临时图像的坐标及其对应的棋子图片,计算出棋局局面图片中各个棋子在棋局中的位置坐标,将位置坐标翻译成计算机能够理解的FEN值;通过本申请解决现有的棋局转化通过手动完成,耗费时间,效率低下的问题。
-
公开(公告)号:CN119539013A
公开(公告)日:2025-02-28
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN118762219A
公开(公告)日:2024-10-11
申请号:CN202410770226.3
申请日:2024-06-14
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/764 , G06V10/40 , G16H30/00 , G16H70/60
Abstract: 本公开的实施例公开了全局特征病理图像分级方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:按照预设分辨率对获取的每个全切片图像进行图像块裁剪,以生成裁剪后图像块信息,得到裁剪后图像块信息集;将裁剪后图像块信息集中的每个裁剪后图像块信息输入至预设目标检测网络,以生成目标区域坐标位置信息和对应目标区域坐标位置的置信度信息,得到目标区域坐标位置信息集和对应目标区域坐标位置集的置信度信息集;对分类结果进行切片分级,得到分级后切片结果。该实施方式缩短了全局特征病理图像分级的周期,降低了误检率和漏检率,提高了全局特征病理图像分级的结果的全局性。
-
公开(公告)号:CN116468725B
公开(公告)日:2023-09-05
申请号:CN202310691667.X
申请日:2023-06-13
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06T7/00 , G06F18/25 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及基于预训练模型的工业缺陷检测方法、装置及存储介质,应用于工业缺陷检测技术领域,包括:通过获取工业缺陷检测图像数据集来训练视觉语言模型,针对每种场景下的每种工业缺陷设置语言文本,通过语言文本描述目标缺陷的特征,将待检测图像和目标缺陷所对应的语言文本一并输入到预训练的视觉语言模型中,这样预训练的视觉语言模型就可以结合待检测图像以及目标缺陷的语言文本,通过在待检测图像上寻找与语言文本相关联的物体区域,从而实现目标缺陷的检测;本申请中,针对每一种缺陷设置不同的语言文本,而不是针对每一种缺陷单独训练模型,从而节省模型训练过程中花费的时间,节约成本,同时还能实现工业检测上多种缺陷的识别检测。
-
公开(公告)号:CN114332637A
公开(公告)日:2022-04-12
申请号:CN202210260622.2
申请日:2022-03-17
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请实施例提供了一种遥感影像水体提取方法、遥感影像水体提取的交互方法,其中,遥感影像水体提取方法包括:获取多个第一遥感图像样本,并根据第一遥感图像样本的光谱信息生成第一遥感图像样本对应的第一水体图像;至少根据第一遥感图像样本与对应的第一水体图像对预设的神经网络模型进行训练,以确定神经网络模型的损失函数;其中,损失函数根据全局损失与局部损失确定,局部损失函数由像素级的交叉熵损失以及像素块的对比损失构成;通过神经网络模型对目标遥感图像进行识别,以生成遥感图像对应的目标水体图像;通过本申请实施例,可以解决相关技术中无法针对大区域遥感影像进行准确且高效的水体识别与分割的技术问题。
-
-
-
-
-
-
-
-
-