-
公开(公告)号:CN119513322A
公开(公告)日:2025-02-25
申请号:CN202510081185.1
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06F16/353 , G06F16/3329 , G06F40/35 , G06F40/284 , G06N3/0455 , G06N3/048
Abstract: 本公开的实施例公开了文本语句情感识别方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:对预先存储的对话文本数据进行数据预处理,得到各个对话文本信息;将各个对话文本信息进行拼接处理,得到各个预处理对话文本数据;生成对话情感基调描述信息集;生成各个语句特征向量集和各个全局对话情感特征向量;生成各个对话图结构信息;生成各个语句情感特征信息集;生成各个文本语句情感类别。该实施方式使得文本语句情感识别的准确性和一致性有所提高。
-
公开(公告)号:CN119539013B
公开(公告)日:2025-04-22
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN119513322B
公开(公告)日:2025-04-01
申请号:CN202510081185.1
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06F16/353 , G06F16/3329 , G06F40/35 , G06F40/284 , G06N3/0455 , G06N3/048
Abstract: 本公开的实施例公开了文本语句情感识别方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:对预先存储的对话文本数据进行数据预处理,得到各个对话文本信息;将各个对话文本信息进行拼接处理,得到各个预处理对话文本数据;生成对话情感基调描述信息集;生成各个语句特征向量集和各个全局对话情感特征向量;生成各个对话图结构信息;生成各个语句情感特征信息集;生成各个文本语句情感类别。该实施方式使得文本语句情感识别的准确性和一致性有所提高。
-
公开(公告)号:CN119540726A
公开(公告)日:2025-02-28
申请号:CN202510104364.2
申请日:2025-01-23
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V10/82 , G06V10/44 , G06V10/50 , G06V10/70 , G06V10/77 , G06V20/13 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/096
Abstract: 本公开的实施例公开了基于上下文增强的遥感基础模型预训练方法和装置。该方法的一具体实施方式包括:获取地面遥感图像集和遥感基础模型;对每个地面遥感图像进行图像块划分以生成图像块向量序列;对每个图像块向量序列进行掩码处理以生成掩码图像块向量序列和原始像素值;将每个掩码图像块向量序列输入遥感基础模型,得到重建像素值集;将每个图像块向量序列输入遥感基础模型,得到预测像素值集;确定遥感基础模型的总损失值,其中,总损失值是重建损失值,预测损失值和一致性损失值的总和;根据总损失值,对遥感基础模型进行反向传播参数更新,得到预训练遥感基础模型。该实施方式可以用来提取准确的遥感特征,减少计算资源的浪费。
-
公开(公告)号:CN119540230B
公开(公告)日:2025-04-15
申请号:CN202510088328.1
申请日:2025-01-21
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/46 , G06V10/26 , G06V10/10 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本公开的实施例涉及工业缺陷检测技术领域,具体涉及图像异常检测模型训练方法、图像异常检测方法和装置。本公开方法的一具体实施方式包括:获取训练样本集、正常类别提示文本、异常类别提示文本、可学习正常类别提示模板、可学习异常类别提示模板和初始图像异常检测模型;执行模型训练步骤:将正常类别拼接文本向量和异常类别拼接文本向量输入文本编码器,得到正常类别文本特征和异常类别文本特征;对样本图像进行图像嵌入处理;将图像块嵌入向量序列输入图像编码器,得到分块特征序列;将分块特征序列、正常类别文本特征和异常类别文本特征输入分割解码器,得到异常分割预测图;确定图像异常检测模型。该实施方式可以提高工业产品缺陷检出效率。
-
公开(公告)号:CN119540230A
公开(公告)日:2025-02-28
申请号:CN202510088328.1
申请日:2025-01-21
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/46 , G06V10/26 , G06V10/10 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本公开的实施例涉及工业缺陷检测技术领域,具体涉及图像异常检测模型训练方法、图像异常检测方法和装置。本公开方法的一具体实施方式包括:获取训练样本集、正常类别提示文本、异常类别提示文本、可学习正常类别提示模板、可学习异常类别提示模板和初始图像异常检测模型;执行模型训练步骤:将正常类别拼接文本向量和异常类别拼接文本向量输入文本编码器,得到正常类别文本特征和异常类别文本特征;对样本图像进行图像嵌入处理;将图像块嵌入向量序列输入图像编码器,得到分块特征序列;将分块特征序列、正常类别文本特征和异常类别文本特征输入分割解码器,得到异常分割预测图;确定图像异常检测模型。该实施方式可以提高工业产品缺陷检出效率。
-
公开(公告)号:CN117576399A
公开(公告)日:2024-02-20
申请号:CN202311605083.2
申请日:2023-11-29
Applicant: 北京航空航天大学 , 北京航空航天大学杭州创新研究院
IPC: G06V10/26 , G06F40/205 , G06F40/279 , G06F40/126 , G06V10/80 , G06V10/764
Abstract: 本发明属于图像分割技术领域,具体涉及一种可泛化的指代表达式图像分割方法,包括对于给定的文本表达式,用统一的形式为其加入直接且关键的提示;将引用表达式送入文本编码器,提取文本特征;将图像输入视觉编码器,结合跨模态注意力对齐机制联合编码视觉特征和文本特征;随后在多模态融合模块,采用多模态特征聚合模块并引入来自预训练视觉模型的引导以利用视觉空间关联;将跨模态融合特征输入解码器,在层级解码过程中引入预训练视觉模型的引导;最后输入分类头,得到图像分割结果。本方法大幅提升了模型对多变的自由文本描述的泛化性,且有效改善了模型对未见视觉目标的泛化性。
-
公开(公告)号:CN119722506A
公开(公告)日:2025-03-28
申请号:CN202411769042.1
申请日:2024-12-04
Applicant: 北京航空航天大学
IPC: G06T5/70 , G06T5/60 , G06N3/0464 , G06N3/0495 , G06N3/048
Abstract: 本发明属于扩散模型量化领域,提出了一种时间步自适应的扩散模型训练后量化方法,包括:步骤S1:获取预训练完毕的全精度扩散模型,并确定采样器和采样策略;步骤S2:基于步骤S1得到的全精度扩散模型和所述采样器生成图像并采样,得到训练后量化的校验集;步骤S3:建立扩散模型,对扩散模型进行量化参数初始化;步骤S4:对所述扩散模型进行重建训练;步骤S5:对经过重建训练的扩散模型进行性能评估。本发明能够有效解决现有量化方法忽略通道间激活值范围差距、未考虑迭代推理特定对量化重建的影响以及量化后模型在低量化位宽下性能崩溃的问题,充分发挥时间步感知的训练后量化方法的优势,量化后的扩散模型具有更优的性能和鲁棒性。
-
公开(公告)号:CN118762219A
公开(公告)日:2024-10-11
申请号:CN202410770226.3
申请日:2024-06-14
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/764 , G06V10/40 , G16H30/00 , G16H70/60
Abstract: 本公开的实施例公开了全局特征病理图像分级方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:按照预设分辨率对获取的每个全切片图像进行图像块裁剪,以生成裁剪后图像块信息,得到裁剪后图像块信息集;将裁剪后图像块信息集中的每个裁剪后图像块信息输入至预设目标检测网络,以生成目标区域坐标位置信息和对应目标区域坐标位置的置信度信息,得到目标区域坐标位置信息集和对应目标区域坐标位置集的置信度信息集;对分类结果进行切片分级,得到分级后切片结果。该实施方式缩短了全局特征病理图像分级的周期,降低了误检率和漏检率,提高了全局特征病理图像分级的结果的全局性。
-
公开(公告)号:CN118506074A
公开(公告)日:2024-08-16
申请号:CN202410615337.7
申请日:2024-05-17
Applicant: 北京航空航天大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06T3/4038 , G06V10/36 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及一种基于对抗补丁定位模型的对抗补丁移除方法,属于图像处理技术领域,本发明设计了对抗补丁移除模型,设计了训练样本生成模块、边缘提取模块、特征提取模块、多尺度特征融合模块和对抗补丁移除模块;用于实现对抗补丁防御,能够更有效的防御对抗补丁攻击,提高下游神经网络的鲁棒性;获取待测图像边缘信息特征提升定位准确性;赋予特征图各个通道不同的权重,融合不同分辨率的特征信息;对对抗补丁定位掩码进行补全,提升预测掩码的召回率,基于补丁区域与原图区域的纹理特征差异对补丁进行检测定位,避免模型关注某种指定纹理的对抗补丁;减少因对抗补丁移除带来的图像语义信息损失。
-
-
-
-
-
-
-
-
-