-
公开(公告)号:CN103077404A
公开(公告)日:2013-05-01
申请号:CN201210593857.X
申请日:2012-12-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于马尔可夫随机场的局部增量式可视化聚类方法,主要包括迭代和处理两个过程,其中:对完全未知的目标数据计算其相异度矩阵,将该矩阵作为迭代过程的输入,得到k阶邻域系统和忠实度矩阵;将迭代过程的输出作为处理过程的输入,得到重排序图像和聚类置信度等信息。该方法根据马尔可夫随机场的性质,采用k阶邻域系统计算全局概率测度;根据k阶邻域系统,通过降维来降低计算复杂度;根据忠实度矩阵,选择最佳划分类别,并且进一步给出聚类结果的置信度。该方法为聚类提供先验信息,直观地了解数据结构和数据类别的分布情况;同时,还能一次即可给出聚类结果和聚类评估;并给出数据隐含复杂结构和聚类置信度。
-
公开(公告)号:CN102902981A
公开(公告)日:2013-01-30
申请号:CN201210340160.1
申请日:2012-09-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于慢特征分析的暴力视频检测方法,包括以下步骤:对已经标好类的视频进行密集轨迹提取,基于轨迹用慢特征分析方法学习出慢特征函数,通过慢特征函数得到视频段的特征表示,最后对提取的特征进行训练并建模;对新来视频进行特征提取,将提取的特征输入到训练得到的模型,得到视频的类别(暴力视频或非暴力视频)。该方法通过密集轨迹提取构建了有效的特征向量,并通过慢特征分析方法学习出了非常具有区分力的视频特征表示。近几年随着社交网站的发展,大量的视频被上传到互联网供用户下载,其中不乏含有暴力内容的视频,这些内容会对青少年产生不良影响,基于慢特征分析的暴力视频检测方法能有效检测出这些不良内容,对建设健康的互联网环境具有重要作用。
-
公开(公告)号:CN120014488A
公开(公告)日:2025-05-16
申请号:CN202510043915.9
申请日:2025-01-10
Applicant: 中国科学院自动化研究所
IPC: G06V20/17 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明提供一种精细化对齐学习的导航模型训练方法、导航方法及装置,该精细化对齐学习的导航模型训练方法包括:对从无人机航拍图像中提取的视觉特征、语义特征和空间特征进行加权融合,得到语义网格特征;基于多项辅助预测任务根据语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;以精细化空中视觉对话导航数据集为训练样本,以视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,综合损失基于导航损失函数和多项辅助预测任务对应的损失函数确定。本发明方法通过全面融合多模态特征,提高了无人机在复杂场景中的导航精度、对齐能力和任务执行效率。
-
公开(公告)号:CN118135660B
公开(公告)日:2025-05-16
申请号:CN202410326444.8
申请日:2024-03-21
Applicant: 山东大学 , 山东科技大学 , 中国科学院自动化研究所 , 银河水滴科技(江苏)有限公司 , 泰华智慧产业集团股份有限公司
IPC: G06V40/20 , G06V10/80 , G06V10/42 , G06V10/82 , G06N3/0464 , G06V10/764
Abstract: 本发明涉及一种视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别方法,包括:(1)构建特征提取模型的网络架构,并进行训练;包括:跨视角全局提取模块构建;跨视角一致性提取模块构建;自适应选择性特征融合模块构建;整体框架训练;(2)跨视角步态识别;包括:将查询数据集的步态轮廓序列送入训练好的视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别模型中提取步态特征,通过与注册数据集进行特征相似性比对,完成查询样本的身份识别。本发明使网络可以更有效地捕捉输入数据中的关键信息,从而提高整个网络在处理不同输入分布情境下的表达能力。
-
公开(公告)号:CN115050465B
公开(公告)日:2025-02-07
申请号:CN202210476331.7
申请日:2022-04-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种诊断数据分析方法及系统,该方法包括:获取目标诊断历史数据对应的医学知识子图谱,并对所述医学知识子图谱进行向量转换,得到疾病代码嵌入向量;基于关系注意力机制、节点注意力机制以及消息传递机制,根据所述疾病代码嵌入向量进行特征提取,并将提取得到的向量特征进行聚合处理,得到特征向量表示;对所述特征向量表示进行诊断预测,得到诊断预测数据。本发明将医学知识图谱与基于关系注意力机制、节点注意力机制以及消息传递机制构建的层次化注意力关系网络进行结合,根据诊断历史数据进行诊断预测,从而得到更为准确的诊断预测结果数据。
-
公开(公告)号:CN118982700A
公开(公告)日:2024-11-19
申请号:CN202410954687.6
申请日:2024-07-16
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本公开提供一种图分类模型的训练方法、预测方法、训练装置和预测装置,训练方法包括:获取包括信息结构图的训练图数据,其中,信息结构图包括分子结构图或情感文本图;分别利用第一子图提取器和第二子图提取器从训练图数据提取第一标签预测性子图和第二标签预测性子图;分别利用第一子图分类器和第二子图分类器预测与第一标签预测性子图和第二标签性子图对应的第一标签和第二标签;根据第一标签、第二标签、第一子图提取器和第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失,并且以综合损失最小为目标调整第一图分类器和第二图分类器的各个参数,以训练得到图分类模型,其中,第一掩码矩阵和第二掩码矩阵彼此不同。
-
公开(公告)号:CN118736355A
公开(公告)日:2024-10-01
申请号:CN202410747440.7
申请日:2024-06-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种视觉语言模型在定位任务中的性能评测方法及装置,其特征在于,定位任务包括基于属性区分的定位任务、基于关系区分的定位任务以及基于主次区分的定位任务,方法包括:构建用于视觉语言模型进行性能评测的评估数据集,针对评估数据集中的评估样本,通过视觉语言模型对评估样本执行定位任务,得到评估样本中的定位热图,根据定位热图确定评估样本的性能评测得分;确定性能评测得分的平均值为评估数据集的平均准确率作为视觉语言模型的性能评测结果。通过本申请,能够验证视觉语言模型在区分属性、区分关系以及区分主次三个维度的组合推理能力,用以解决现有技术中预训练的视觉语言模型在组合推理能力方面表现差的缺陷。
-
公开(公告)号:CN118334631A
公开(公告)日:2024-07-12
申请号:CN202410420690.X
申请日:2024-04-09
Applicant: 中国科学院自动化研究所
IPC: G06V20/59 , G06V20/40 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明涉及计算机视觉技术领域,提供一种驾驶行为预测模型构建方法、预测方法、装置、设备和介质,构建方法包括:获取视频样本、原始标签以及初始模型;基于第一模块,对视频样本对应的帧序列进行粗粒度行为特征提取,得到粗粒度行为特征;基于第二模块,对粗粒度行为特征进行方向特征提取,得到方向特征;基于第三模块,对方向特征进行细粒度行为特征提取,得到细粒度行为特征;分别进行粗粒度行为预测、方向预测和细粒度行为预测,得到粗粒度行为预测结果、方向预测结果和细粒度行为预测结果;基于预测结果和原始标签,对初始模型进行参数迭代,得到驾驶行为预测模型。本发明提供的方法、装置、设备和介质,能够提高驾驶行为预测性能。
-
公开(公告)号:CN118135660A
公开(公告)日:2024-06-04
申请号:CN202410326444.8
申请日:2024-03-21
Applicant: 山东大学 , 山东科技大学 , 中国科学院自动化研究所 , 银河水滴科技(江苏)有限公司 , 泰华智慧产业集团股份有限公司
IPC: G06V40/20 , G06V10/80 , G06V10/42 , G06V10/82 , G06N3/0464 , G06V10/764
Abstract: 本发明涉及一种视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别方法,包括:(1)构建特征提取模型的网络架构,并进行训练;包括:跨视角全局提取模块构建;跨视角一致性提取模块构建;自适应选择性特征融合模块构建;整体框架训练;(2)跨视角步态识别;包括:将查询数据集的步态轮廓序列送入训练好的视角缺失条件下的联合多视角信息瓶颈的跨视角步态识别模型中提取步态特征,通过与注册数据集进行特征相似性比对,完成查询样本的身份识别。本发明使网络可以更有效地捕捉输入数据中的关键信息,从而提高整个网络在处理不同输入分布情境下的表达能力。
-
公开(公告)号:CN118133890A
公开(公告)日:2024-06-04
申请号:CN202410165435.5
申请日:2024-02-05
Applicant: 中国科学院自动化研究所
IPC: G06N3/0455 , G06N3/042 , G06N3/0475 , G06N3/094 , G06N3/0895 , G06F16/901
Abstract: 本申请实施例提供一种基于对抗式掩码的图表征向量生成方法、装置及存储介质,所述方法包括:获取图结构数据;将所述图结构数据输入至训练后的图掩码自编码器模型中,获取所述训练后的图掩码自编码器模型输出的第一图表征向量。本申请实施例提供的基于对抗式掩码的图表征向量生成方法、装置及存储介质,可以通过训练后的图掩码自编码器模型获取图结构数据的图表征向量,解决现有图掩码自编码器模型中未考虑特征重构难易程度和表征均匀性未被严格约束的问题,实现表征质量增强的图自监督表示学习,进而实现更加精准的节点类型和图类型预测。
-
-
-
-
-
-
-
-
-