-
公开(公告)号:CN105701173B
公开(公告)日:2019-11-15
申请号:CN201610001348.1
申请日:2016-01-05
Applicant: 中国电影科学技术研究所 , 北京信息科技大学
IPC: G06F16/583
Abstract: 本发明涉及一种基于外观设计专利的多模态图像检索方法,包括以下步骤:步骤1):提出有效内容提取算法提取图像有效内容,并对图像进行预处理操作;步骤2):提取图像文本特征;步骤3):提取图像快速局部方向模式视觉特征;步骤4):将图像文本特征与视觉特征融合,对图像进行多模态检索。本发明提出一种融合文本特征与底层视觉特征的多模态图像检索算法,充分发挥了不同模态特征的优点,提高了检索准确率,该方法优于已有的单模态检索方法,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105701174B
公开(公告)日:2019-04-23
申请号:CN201610001349.6
申请日:2016-01-05
Applicant: 中国电影科学技术研究所 , 北京信息科技大学
IPC: G06F16/583
Abstract: 本发明涉及一种基于动态纹理基元的外观设计专利检索方法,包括以下步骤:步骤1):提取纹理基元;步骤2):对纹理基元提取基于统计分析的LBP特征,并对提取的特征向量进行归一化和相似性度量,返回检索结果。本发明以外观设计专利为基础,针对不同图像纹理基元大小不一定相等的特点,本发明提出一种根据图像内容动态提取纹理基元并对纹理基元提取特征的图像检索算法。在检索具有重复纹理基元的图像时,本发明的检索效果优于已有的基于整幅图像的检索方法,能检索出具有相同纹理基元,但排列结构不同的图像,可用于图像纹理结构相似性判断,具有良好的检索效果,可以很好地满足实际应用的需要。
-
公开(公告)号:CN107977612A
公开(公告)日:2018-05-01
申请号:CN201711170160.0
申请日:2017-11-21
Applicant: 中国电影科学技术研究所 , 北京信息科技大学
Abstract: 本发明涉及一种红外图像人数识别方法,包括以下步骤:步骤一:将整张图像根据人体之间的粘连情况分为若干个连通域;步骤二:先采用归一化像素统计的方法逐个统计各连通域内人数;当连通域内人数大于设定的阈值时,放弃采用归一化像素统计的方法统计得出的该连通域内的人数结果,进入步骤三;否则,保留采用归一化像素统计的方法统计该连通域内人数结果;步骤三:采用基于粘连人体分割的人数统计方法统计人数。本发明提供的红外图像人数识别方法,采用像素特征和粘连人体分割相结合的检测方法,检测效果好,能够准确地定位出人体所在位置并统计出人数,误差很小,统计结果准确度很高,可以很好地满足实际应用的需要。
-
公开(公告)号:CN108921830A
公开(公告)日:2018-11-30
申请号:CN201810639977.6
申请日:2018-06-21
Applicant: 北京信息科技大学 , 中国电影科学技术研究所
Abstract: 本发明涉及一种基于图像检索的人数统计方法,包括:将原图像分成多个具有相同透视效果的不同尺度子图像块;改进空间金字塔池化网络模型,使用训练数据训练改进的空间金字塔池化网络模型;使用改进的空间金字塔池化网络提取不同尺寸图像的特征;计算待测图像与已知图像间的距离,寻找距离最近的图像,获取其标签,得到待测子图像块的人数;将待测图像所分割的不同子图像块人数累加。本发明提供的基于图像检索的人数统计方法,对传统的空间金字塔池化网络模型进行了改进,采用改进的空间金字塔池化网络模型,避免了在图像尺寸归一化时造成的特征损失,人数识别准确率高,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105701174A
公开(公告)日:2016-06-22
申请号:CN201610001349.6
申请日:2016-01-05
Applicant: 中国电影科学技术研究所 , 北京信息科技大学
IPC: G06F17/30
CPC classification number: G06F17/30262
Abstract: 本发明涉及一种基于动态纹理基元的外观设计专利检索方法,包括以下步骤:步骤1):提取纹理基元;步骤2):对纹理基元提取基于统计分析的LBP特征,并对提取的特征向量进行归一化和相似性度量,返回检索结果。本发明以外观设计专利为基础,针对不同图像纹理基元大小不一定相等的特点,本发明提出一种根据图像内容动态提取纹理基元并对纹理基元提取特征的图像检索算法。在检索具有重复纹理基元的图像时,本发明的检索效果优于已有的基于整幅图像的检索方法,能检索出具有相同纹理基元,但排列结构不同的图像,可用于图像纹理结构相似性判断,具有良好的检索效果,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105701173A
公开(公告)日:2016-06-22
申请号:CN201610001348.1
申请日:2016-01-05
Applicant: 中国电影科学技术研究所 , 北京信息科技大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于外观设计专利的多模态图像检索方法,包括以下步骤:步骤1):提出有效内容提取算法提取图像有效内容,并对图像进行预处理操作;步骤2):提取图像文本特征;步骤3):提取图像快速局部方向模式视觉特征;步骤4):将图像文本特征与视觉特征融合,对图像进行多模态检索。本发明提出一种融合文本特征与底层视觉特征的多模态图像检索算法,充分发挥了不同模态特征的优点,提高了检索准确率,该方法优于已有的单模态检索方法,可以很好地满足实际应用的需要。
-
公开(公告)号:CN115858813B
公开(公告)日:2025-05-16
申请号:CN202211628660.5
申请日:2022-12-20
Applicant: 北京信息科技大学 , 北京市工程咨询股份有限公司
IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/3329 , G06F40/30
Abstract: 本发明涉及面向工程咨询报告的文本检索方法,以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题,包括以下步骤:构建面向工程咨询报告的文本检索语料集,使用语料集微调simCSE对比学习模型,将得到的模型参数初始化Vanilla BERT模型,将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型,得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合,得到最终的匹配分数,完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法,有效增强了文本检索的效果。
-
公开(公告)号:CN117710661B
公开(公告)日:2025-04-15
申请号:CN202410009296.7
申请日:2024-01-04
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种基于矩形可变形卷积的遥感图像目标检测方法,属于目标检测技术领域,包括利用遥感图像目标检测数据集训练改进的Oriented RCNN模型;其中,设计矩形可变形卷积替换卷积神经网络中的一般卷积,在特征金字塔网络中加入了高级和低级特征融合模块并应用子像素卷积生成高分辨率特征图,删除检测头的两个共享的全连接层并在分类和回归分支分别使用适配网络,得到改进的Oriented RCNN模型;将改进的Oriented RCNN模型用于遥感图像目标检测中。本发明使用了矩形可变形卷积能够更好地适应遥感图像目标的几何变换,特征融合模块用于检索尺度较小的目标。本发明可获得更好的目标检测精度。
-
公开(公告)号:CN119741625A
公开(公告)日:2025-04-01
申请号:CN202411956595.8
申请日:2024-12-29
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种基于跨头部协同蒸馏与特征标准化的航拍图像目标检测方法,其特征在于,包括:训练教师网络,得到一个准确度较高的教师网络;随机初始化学生网络,输入图像之后通过特征金字塔结构获取教师和学生网络的多尺度特征;使用特征共享标准化层获取标准化的教师和学生网络的特征,并求特征相关性损失;将学生网络头部特征通过共享标准化层输入跨头部输入教师网络头部,求得预测一致性损失;通过标签获取学生网络的有监督损失;根据反向传播的梯度信息更新学生网络的权重值。本发明可以通过跨头标准化的方法提升目标检测模型蒸馏效果,使较少参数量的目标检测学生网络获得和较大参数的教师模型近似的精度。
-
公开(公告)号:CN118093874A
公开(公告)日:2024-05-28
申请号:CN202410275955.1
申请日:2024-03-12
IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤:通过将网格结构无损转换为扁平结构,实现音节序列中单词信息的引入;采用相对位置编码机制,编码音节和单词的位置和方向信息;使用多头自注意力机制,识别序列中音节和单词的关联关系和语义信息;最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题,其中多头注意力机制的运用,丰富了词语间的关联关系,增强了句子语义和句法结构信息的理解,提高了低资源语言新闻句子情感分类效果。
-
-
-
-
-
-
-
-
-