-
公开(公告)号:CN109345572A
公开(公告)日:2019-02-15
申请号:CN201810896726.6
申请日:2018-08-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及图像处理技术领域,并提出了一种混沌启发式搜索优化的弓网图像配准方法及装置,旨在解决人工蜂群优化算法应用于弓网图像配准时容易出现收敛速度慢,配准精度不足的技术问题。为此目的,本发明中的混沌启发式搜索优化的弓网图像配准方法包括:根据预设的参考弓网图像,生成初始种群;初始种群中的每个个体存储有预定数目个配准参数;利用混沌启发式搜索算法优化待配准弓网图像的配准参数;利用配准参数对待配准弓网图像进行空间变换,得到配准的弓网图像。本发明可以增强算法的局部搜索能力,加快算法的收敛速度,提高弓网图像配准的精度。
-
公开(公告)号:CN107392201A
公开(公告)日:2017-11-24
申请号:CN201710437485.4
申请日:2017-06-09
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/3258 , G06K9/6267 , G06K2209/01 , G06N3/0454
Abstract: 本发明涉及图像识别领域,具体提出一种接触网支柱的支柱号识别方法、存储介质、处理设备,旨在解决接触网的全局图像效果较差时,不能快速准确地识别接触网支柱号牌的问题。本发明的接触网支柱的支柱号识别方法将设计优化后的号牌检测模型、字符检测模型,依次用于对全局图像进行号牌区域图像的提取、字符区域图像的提取,通过字符识别算法获取支柱号牌字符组,然后基于全局图像采集的顺序、预设的接触网支柱排序规则、已识别的支柱号牌对支柱号牌字符组进行修正。通过本发明可以在接触网的全局图像效果较差时也能准确快速地识别出接触网支柱号牌。
-
公开(公告)号:CN119557599A
公开(公告)日:2025-03-04
申请号:CN202510088173.1
申请日:2025-01-20
Applicant: 中国科学院自动化研究所
IPC: G06F18/20 , G06F18/2115 , G06F18/214 , G06N3/092 , G05D1/00
Abstract: 本申请公开了一种可解释的无人机任务决策方法及装置。所述无人机任务决策方法包括:获取针对无人机决策任务的第一输入数据集;将第一输入数据集输入到预先构建的第一预设决策模型,得到用于输出决策结果的第一策略数据集,第一策略数据集包括用于指示无人机针对目标任务的下一动作的调整方案;将第一策略数据集和第一输入数据集输入到基于SHAP算法的特征分析模型,得到针对无人机决策任务的决策特征数据集,决策特征数据集包括与调整方案相对应的无人机决策特征数据;利用决策特征数据集构建基于决策树算法的第二预设决策模型,得到用于呈现针对调整方案的决策路径和决策依据的决策树数据,作为用于解释无人机决策任务的解释数据集。
-
公开(公告)号:CN118535724A
公开(公告)日:2024-08-23
申请号:CN202410602542.X
申请日:2024-05-15
Applicant: 中国科学院自动化研究所
IPC: G06F16/34 , G06F40/295 , G06F40/117 , G06F40/284 , G06F18/214 , G06N3/0455 , G06N3/045 , G06N3/0895
Abstract: 本发明提供一种摘要生成方法、装置、电子设备及存储介质,应用于数据处理技术领域。该方法包括:获取待处理的文本数据,所述文本数据包括多个词汇;将所述文本数据和模型提示模版输入第一网络模型,得到标注文本,所述模型提示模版用于提示所述第一网络模型识别输入文本中的命名实体与事件,所述标注文本包括对所述多个词汇中部分词汇的标注信息;将所述文本数据和所述标注文本输入第二网络模型,得到所述文本数据的摘要信息;其中,所述第一网络模型用于对文本数据中的命名实体与事件进行标注,所述第二网络模型用于根据标注文本生成文本数据的摘要信息。
-
公开(公告)号:CN113239820B
公开(公告)日:2023-06-27
申请号:CN202110540829.0
申请日:2021-05-18
Applicant: 中国科学院自动化研究所
IPC: G06V40/10 , G06V10/774 , G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明属于模式识别领域,具体涉及了一种基于属性定位与关联的行人属性识别方法及系统,旨在解决现有技术无法有效结合属性的局部定位特征和全局关联特征,从而行人属性识别模型的性能尚达不到预期的问题。本发明包括:通过特征提取网络获取输入行人图像的特征图;通过多分枝的属性定位网络对属性解藕,每个属性分枝单独对属性特征在高度、宽度和通道三个维度方面,进行属性定位特征的增强;通过属性关联网络学习不同属性之间的全局关联性特征;最终通过分类器获取行人的属性类别。本发明更好地提取到关于行人属性的局部定位特征,并有效地结合属性的局部定位特征和全局关联特征,行人属性识别的准确性与精度以及效率高。
-
公开(公告)号:CN116259076A
公开(公告)日:2023-06-13
申请号:CN202310118267.X
申请日:2023-02-01
Applicant: 中国科学院自动化研究所
IPC: G06V40/10 , G06V10/774 , G06V10/80 , G06V10/762 , G06N3/0464 , G06N3/088
Abstract: 本发明提供一种基于孪生网络的行人搜索模型的训练方法、装置、电子设备和存储介质,其中方法包括:确定训练图像;根据孪生网络的下分支对训练图像进行特征提取,得到训练图像中各行人的特征向量;对训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对多尺度行人图像进行特征提取,得到训练图像中各行人的多尺度特征向量;根据特征向量和多尺度特征向量进行训练,并在训练完成时得到训练好的行人搜索模型。提高了在进行行人搜索时对在不同尺度下的行人进行准确的搜索。
-
公开(公告)号:CN113705541B
公开(公告)日:2022-04-01
申请号:CN202111224946.2
申请日:2021-10-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于Transformer的标记选择和合并的表情识别方法及系统,包括:将图像分割成不重叠的斑块,并通过线性投影映射到一个D维度的特征向量,构成标记嵌入向量;将其输入第一Transformer网络,得到标记特征;动态地加入α参数计算标记特征的每个标记向量的权重,将标记向量的权重的数值较大的前k个标记向量输入第二Transformer网络,得到动态标记选择的预测结果;将标记特征进行重塑,得到新的结构化特征,并合并,组成包含上下文特征的标记;将其输入第三Transformer网络编码,得到标记合并的预测结果;取动态标记选择的预测结果和标记合并的预测结果取平均,取阈值最大的为表情识别的结果。
-
公开(公告)号:CN113641867A
公开(公告)日:2021-11-12
申请号:CN202110934772.2
申请日:2021-08-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/901 , G06F40/216 , G06F40/289 , G06Q50/26
Abstract: 本发明属于城市关系测度领域,具体涉及一种基于微博舆情的城市间关系测度系统、方法、设备,旨在解决传统的城市测度方法需要耗费大量的精力统计或搜集基础数据,并且基础数据的时效性滞后,导致城市间的关系测度时效性、准确性较低的问题。本系统包括城市舆情爬取子模块、舆情信息整理子模块与城市关系测度子模块;所述舆情信息整理子模块包括有向无环图分词单元、BERT分词单元和加权计算单元;所述城市关系测度子模块包括第一频率计算单元、第二频率计算单元、城市关系测度单元。本发明提升了城市间的关系测度时效性、准确性。
-
公开(公告)号:CN113239820A
公开(公告)日:2021-08-10
申请号:CN202110540829.0
申请日:2021-05-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于模式识别领域,具体涉及了一种基于属性定位与关联的行人属性识别方法及系统,旨在解决现有技术无法有效结合属性的局部定位特征和全局关联特征,从而行人属性识别模型的性能尚达不到预期的问题。本发明包括:通过特征提取网络获取输入行人图像的特征图;通过多分枝的属性定位网络对属性解藕,每个属性分枝单独对属性特征在高度、宽度和通道三个维度方面,进行属性定位特征的增强;通过属性关联网络学习不同属性之间的全局关联性特征;最终通过分类器获取行人的属性类别。本发明更好地提取到关于行人属性的局部定位特征,并有效地结合属性的局部定位特征和全局关联特征,行人属性识别的准确性与精度以及效率高。
-
公开(公告)号:CN112347995A
公开(公告)日:2021-02-09
申请号:CN202011380458.6
申请日:2020-11-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于模式识别技术领域,具体涉及一种基于像素转移和特征转移相融合的无监督行人再识别方法、系统、装置,旨在解决现有的跨数据集无监督行人再识别方法检索精度低、识别准确度差的问题。本系统方法包括获取待识别的行人图像,作为输入图像;基于输入图像,通过预训练的行人再识别模型得到行人再识别结果;所述行人再识别模型基于残差网络构建。本发明提高了现有跨数据集的无监督行人再识别方法的检索精度以及识别准确度。
-
-
-
-
-
-
-
-
-