-
公开(公告)号:CN119539013B
公开(公告)日:2025-04-22
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN119513322B
公开(公告)日:2025-04-01
申请号:CN202510081185.1
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06F16/353 , G06F16/3329 , G06F40/35 , G06F40/284 , G06N3/0455 , G06N3/048
Abstract: 本公开的实施例公开了文本语句情感识别方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:对预先存储的对话文本数据进行数据预处理,得到各个对话文本信息;将各个对话文本信息进行拼接处理,得到各个预处理对话文本数据;生成对话情感基调描述信息集;生成各个语句特征向量集和各个全局对话情感特征向量;生成各个对话图结构信息;生成各个语句情感特征信息集;生成各个文本语句情感类别。该实施方式使得文本语句情感识别的准确性和一致性有所提高。
-
公开(公告)号:CN119540726A
公开(公告)日:2025-02-28
申请号:CN202510104364.2
申请日:2025-01-23
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V10/82 , G06V10/44 , G06V10/50 , G06V10/70 , G06V10/77 , G06V20/13 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/096
Abstract: 本公开的实施例公开了基于上下文增强的遥感基础模型预训练方法和装置。该方法的一具体实施方式包括:获取地面遥感图像集和遥感基础模型;对每个地面遥感图像进行图像块划分以生成图像块向量序列;对每个图像块向量序列进行掩码处理以生成掩码图像块向量序列和原始像素值;将每个掩码图像块向量序列输入遥感基础模型,得到重建像素值集;将每个图像块向量序列输入遥感基础模型,得到预测像素值集;确定遥感基础模型的总损失值,其中,总损失值是重建损失值,预测损失值和一致性损失值的总和;根据总损失值,对遥感基础模型进行反向传播参数更新,得到预训练遥感基础模型。该实施方式可以用来提取准确的遥感特征,减少计算资源的浪费。
-
公开(公告)号:CN118154934A
公开(公告)日:2024-06-07
申请号:CN202410095373.5
申请日:2024-01-23
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/764 , G06V10/74 , G06V10/141 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/092 , G06N3/084
Abstract: 本公开的实施例公开了垃圾分类方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:响应于采集组件采集到目标人员的靠近信息,控制采集组件采集目标环境信息;根据目标环境信息,控制拍摄组件采集至少一个人员图像;对至少一个人员图像中的每个人员图像进行目标物识别处理,以生成目标框选图像,得到目标框选图像集;将目标框选图像集输入至预先训练的垃圾识别模型中,得到垃圾类别信息;根据垃圾类别信息,控制控制组件打开垃圾类别信息对应的垃圾桶的桶盖。该实施方式减少了电力资源的浪费,以及减少了对垃圾进行分类的时间。
-
公开(公告)号:CN114360060B
公开(公告)日:2024-04-09
申请号:CN202111671031.6
申请日:2021-12-31
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V40/20
Abstract: 本发明公开了一种人体动作识别计数方法,包括以下步骤:将人体动作分解为冠状面和矢状面两个平面内的动作,采集人体平面内动作实时视频图像,将所述实时视频图像进行分帧和预处理后,输入人体关键骨骼点检测网络模型,输出每帧图像上的人体关键骨骼点检测结果;将得到的所述人体关键骨骼点检测结果输入预先配置的动作状态特征机,所述动作状态特征机按照所述人体关键骨骼点的置信度约束条件和特征点约束条件,确定用户是否完成对应动作。本发明采用一个通用模型匹配不同动作状态特征机,代码复用率高且计算量小,占用存储空间小,特征表达强,在保证计数准确的同时,具有更快的系统响应速度。
-
公开(公告)号:CN117636353A
公开(公告)日:2024-03-01
申请号:CN202311704761.0
申请日:2023-12-11
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了待标注图像分割方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取待标注图像;将待标注图像输入至预先训练好的物体标签预测模型,得到目标物体标签;将待标注图像与目标物体标签输入至预先训练好的视觉语义检索模型,得到相似度图,其中,相似度图表征待标注图像中各个带标注图像像素点与目标物体标签的各个相似度;将相似度图中满足预设条件的各个相似度像素点确定为初始采样像素点集;将待标注图像与初始采样像素点集输入至预先训练好的分割模型,以生成各个预测分割图像;对各个预测分割图像进行迭代修正处理,以生成对应待标注图像的分割图像。该实施方式提高了分割图像的分割准确率。
-
公开(公告)号:CN117636100A
公开(公告)日:2024-03-01
申请号:CN202410101911.7
申请日:2024-01-25
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/045 , G06N3/084
Abstract: 本公开的实施例公开了预训练任务模型调整处理方法、装置、电子设备和介质。该方法的一具体实施方式包括:根据未标注图像集合,生成标注图像组集合;生成标注特征向量组集合;根据标注图像组集合,确定聚类类别信息;生成未标注特征向量集合;对未标注特征向量集合进行聚类处理;生成聚类中心信息集合;生成标注图像中心信息集合;根据聚类中心信息集合和标注图像中心信息集合,确定校准中心信息集合;根据校准中心信息集合,生成特征向量组集合;确定伪标签特征向量组集合;确定扩展标签图像组集合;对预训练任务模型进行调整处理。该实施方式可以减少计算机处理器资源的浪费,缩减所选择数据的类别分布与总体样本的类别分布偏差。
-
公开(公告)号:CN117333560B
公开(公告)日:2024-02-20
申请号:CN202311631211.0
申请日:2023-12-01
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06T9/00 , G06T7/41 , G06V10/764
Abstract: 本公开的实施例公开了场景自适应的条纹结构光解码方法、装置、设备和介质。该方法的一具体实施方式包括:获取对应目标物体的全局照明图像和反射图像序列;对反射图像序列进行分类,得到第一反射图像子序列、第二反射图像子序列和第三反射图像子序列;根据全局照明图像、第一反射图像子序列和第二反射图像子序列,生成各个归一化像素值组;确定各个条纹宽度信息组;对各个归一化像素值组进行亚像素定位,以确定各个亚像素位置信息;对第三反射图像子序列中的各个第三反射图像进行解码,以生成各个解码信息;生成对应目标物体的各个点云信息。该实施方式可以提高条纹亚像素定位的精度,从而可以提高所获取的点云信息准确率且减少点云信息的缺失。
-
公开(公告)号:CN116689408A
公开(公告)日:2023-09-05
申请号:CN202310954866.5
申请日:2023-08-01
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了基于三维点云的圆柱状轮胎模具激光清洗装置和方法。该方法的一具体实施方式包括:响应于检测到待清洗轮胎模具放置在预设位置范围内,控制预设位置范围内的各个相关联的气缸向预设中心点位置挤压;控制3D相机采集待清洗轮胎模具内壁的点云数据;根据点云数据,生成对应待清洗轮胎模具的三维圆柱体模型;根据三维圆柱体模型、预存坐标系转换信息和预设采样信息,确定清洗路径;根据清洗路径,控制机械臂移动,以及控制激光器对待清洗轮胎模具进行清洗。该实施方式提升了清洗轮胎模具的效率,减少了设备维护消耗的资源和轮胎模具的磨损。
-
公开(公告)号:CN116577350A
公开(公告)日:2023-08-11
申请号:CN202310856924.0
申请日:2023-07-13
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了物料表面毛球点云采集装置和物料表面毛球数据采集方法。该方法的一具体实施方式包括:响应于确定目标物料与3D相机之间的距离不满足预设距离条件,控制竖直位移组件移动,以使目标物料与3D相机的距离满足预设距离条件;根据预设扫描路径,控制水平位移组件移动,以及控制点云采集组件采集目标物料的各个表面毛球子数据;响应于检测到水平位移组件按照预设扫描路径完成位移,控制水平位移组件停止移动;根据预设扫描路径,拼接点云采集组件采集到的目标物料的各个表面毛球子数据,得到目标物料的表面毛球数据。该实施方式提升了物料起毛起球质量等级检测的准确率。
-
-
-
-
-
-
-
-
-