-
公开(公告)号:CN117132785A
公开(公告)日:2023-11-28
申请号:CN202311140472.2
申请日:2023-09-06
Applicant: 北京航空航天大学
Abstract: 本发明涉及一种基于增量目标检测模型IODC的增量目标检测方法,属于图像识别技术领域,基于CLIP模型融合全局感知类别文本模型和视觉模型获得增量目标检测模型IODC,用于对图片的增量学习,可以识别图片中未知类别的对象,提高对图片的识别率,解决了现有技术中增量检测中出现的标签丢失、检测不到目标中的潜在对象和检测实验的训练周期长的问题。
-
公开(公告)号:CN116468725B
公开(公告)日:2023-09-05
申请号:CN202310691667.X
申请日:2023-06-13
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06T7/00 , G06F18/25 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及基于预训练模型的工业缺陷检测方法、装置及存储介质,应用于工业缺陷检测技术领域,包括:通过获取工业缺陷检测图像数据集来训练视觉语言模型,针对每种场景下的每种工业缺陷设置语言文本,通过语言文本描述目标缺陷的特征,将待检测图像和目标缺陷所对应的语言文本一并输入到预训练的视觉语言模型中,这样预训练的视觉语言模型就可以结合待检测图像以及目标缺陷的语言文本,通过在待检测图像上寻找与语言文本相关联的物体区域,从而实现目标缺陷的检测;本申请中,针对每一种缺陷设置不同的语言文本,而不是针对每一种缺陷单独训练模型,从而节省模型训练过程中花费的时间,节约成本,同时还能实现工业检测上多种缺陷的识别检测。
-
公开(公告)号:CN114782290A
公开(公告)日:2022-07-22
申请号:CN202210715254.6
申请日:2022-06-23
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了视差图修正方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取双目图像中的左图像和右图像;将左图像和右图像重复输入多分支的立体匹配网络,得到各个分支对应的各个分支概率分布信息集合;根据各个分支概率分布信息集合,生成分支目标概率分布信息集合和预测分支置信度信息集合;根据分支目标概率分布信息集合和预测分支置信度信息集合,生成预测视差图的置信度信息;根据置信度信息,修正预测视差图,得到修正视差图。该实施方式可以在训练过程中无需提供置信度信息标签,即可在半监督、全监督、无监督等任务中生成视差图的置信度信息,从而可以用于修正视差图。
-
公开(公告)号:CN114663732A
公开(公告)日:2022-06-24
申请号:CN202210571639.X
申请日:2022-05-25
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/778 , G06K9/62
Abstract: 本申请涉及基于表征学习的基于表征学习的棋类局面转化模型建立、转化方法及装置,属于图像识别技术领域。本申请包括:通过骨干网络提取预先标注好的棋局局面图片的特征,分层提取所述特征生成多尺度特征层;将所述多尺度特征层输入到目标检测特殊层中生成多个候选框,对所述多个候选框进行筛选获得标准候选框;计算所述标准候选框与预先标注之间的损失值,通过梯度下降调整模型参数使得损失值不再降低或达到预设的迭代次数,获得棋类局面转化模型;通过本申请解决现有技术中,只能匹配模板库内已有的模板,对于新的图像,无法进行准确匹配,且基于模板匹配的方法,对图像尺寸要求严苛,若图像尺寸不匹配,匹配精度也会降低的问题。
-
公开(公告)号:CN114529552A
公开(公告)日:2022-05-24
申请号:CN202210202403.9
申请日:2022-03-03
Applicant: 北京航空航天大学 , 应急管理部国家减灾中心
IPC: G06T7/10 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种基于几何轮廓顶点预测的遥感影像建筑物分割方法,本方法首先使用两阶段检测网络结构,通过该网络从遥感影像中提取建筑物的特征信息,利用ROI‑Align操作对建筑物检测框进行操作得到建筑物的特征图,然后在该特征图上使用基于注意力机制的长短时记忆网络对建筑物轮廓进行建模预测,在轮廓预测过程中,先做边缘检测和关键点检测,将关键点得分最高的顶点作为开始顶点,输入到基于注意力机制的长短时记忆网络中开始预测,直到碰到结束标志或达到最大时序长度时结束预测,最后将预测的顶点结果映射到原图,并按照顺序相连得到建筑物的轮廓。
-
公开(公告)号:CN113221778B
公开(公告)日:2022-05-10
申请号:CN202110546506.2
申请日:2021-05-19
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V30/413 , G06V30/148 , G06T7/187 , G06T7/62
Abstract: 本申请涉及一种手写表格的检测与识别方法及装置,手写表格的检测与识别方法包括获取表格图像,在表格图像中获取白色连通域信息,根据白色连通域信息确定多个白色连通域的外接矩形框,统计各个外接矩形框的面积大小及数量,根据各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,根据单元格内容的连通域检测识别表格结构。本申请对获取的表格图像质量要求低,简单易操作,并且通过各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,在文字与表格框出现粘连时仍能有效识别且识别准确性高。
-
公开(公告)号:CN114332637A
公开(公告)日:2022-04-12
申请号:CN202210260622.2
申请日:2022-03-17
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请实施例提供了一种遥感影像水体提取方法、遥感影像水体提取的交互方法,其中,遥感影像水体提取方法包括:获取多个第一遥感图像样本,并根据第一遥感图像样本的光谱信息生成第一遥感图像样本对应的第一水体图像;至少根据第一遥感图像样本与对应的第一水体图像对预设的神经网络模型进行训练,以确定神经网络模型的损失函数;其中,损失函数根据全局损失与局部损失确定,局部损失函数由像素级的交叉熵损失以及像素块的对比损失构成;通过神经网络模型对目标遥感图像进行识别,以生成遥感图像对应的目标水体图像;通过本申请实施例,可以解决相关技术中无法针对大区域遥感影像进行准确且高效的水体识别与分割的技术问题。
-
公开(公告)号:CN114299526A
公开(公告)日:2022-04-08
申请号:CN202111602980.9
申请日:2021-12-24
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V30/412 , G06V30/148 , G06V30/226
Abstract: 本申请涉及一种手写棋谱录入方法及设备,方法包括:获取手写棋谱图像;基于交互式区域生长算法将手写棋谱图像有序分割成多个独立表格区域,将分割得到的各独立表格区域压入第一堆栈中,依次从第一堆栈中提取独立表格区域并获取独立表格区域对应的字符信息,将各独立表格区域对应的字符信息进行标注并保存。由于各独立表格区域均对应一张手写棋谱表格,本申请中,在待识别的手写棋谱图像中包含多个手写棋谱表格时,基于交互式区域生长算法对多个手写棋谱表格进行有序分割并依次单独识别,由于手写棋谱表格是进行有序分割的,后续可以将识别出的字符信息根据其对应的手写棋谱表格进行标注后进行保存。
-
公开(公告)号:CN113901902A
公开(公告)日:2022-01-07
申请号:CN202111155721.6
申请日:2021-09-30
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种基于层级图卷积网络的群体场景图生成方法,利用预训练卷积神经网络提取体育视频中所有个体的视觉特征和包围盒,聚类为两个队伍,根据视觉特征构造队伍关系图和群体关系图,将队伍关系图输入队伍图卷积网络提取队伍关系特征,将群体关系图输入群体图卷积网络提取群体关系特征,根据队伍关系特征和群体关系特征生成群体场景图,上述方法能有效捕捉体育视频中群体间关系,生成群体场景图进行体育视频理解。在团体对抗型体育项目中,运动员个体间关系被弱化,队伍间关系得到凸显,因此能简化场景图生成方法的应用场景,将场景图生成方法应用于体育视频捕捉群体间关系,生成群体场景图进行体育视频的理解。
-
公开(公告)号:CN112258420A
公开(公告)日:2021-01-22
申请号:CN202011205932.1
申请日:2020-11-02
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请涉及基于DQN的图像增强处理方法及装置,其方法包括,步骤1、获取待处理的图像,初始化评价总分;步骤2、基于预先构建的操作选择网络对待处理图像的每一像素点进行数值操作,得到待评价图像,其中操作选择网络基于DQN算法构建及更新;步骤3、采用预设评价方式对待评价图像进行评分,根据得到的奖励分数对评价总分进行累加更新;步骤4、将评价总分与预定阈值进行比较,当其小于等于第一阈值时,将其清零,跳转执行步骤2,当其大于第一阈值且小于第二阈值时,以待评价图像作为新的待处理图像,跳转执行步骤2,当其大于等于第二阈值时,以待评价图像作为图像增强处理后的图像。本申请消除了图像增强处理对成对数据集的依赖,大幅降低了数据搜集难度。
-
-
-
-
-
-
-
-
-