-
公开(公告)号:CN112000818B
公开(公告)日:2023-05-12
申请号:CN202010663328.7
申请日:2020-07-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/432 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种面向文本和图像的跨媒体检索方法及电子装置,提取一设定长度语音信息的g维MFCC特征,并将长度为m的g维MFCC特征转换为一维语音特征;对一设定文本进行编码,获取词级别文本表示,并将词级别文本表示中每一个词与一维语音特征进行拼接,得到语音引导文本特征;提取每一图片的区域特征,计算区域特征与语音引导文本特征的相似性分数,判断该图片是否包含设定语音信息及设定文本信息,得到检索结果。本发明利用语音信息的停顿信息,以及语音信息与图像和文本间的关联关系来提升图像‑文本匹配任务的性能,建模了融合语音信息的文本特征表示,引入基于局部注意力机制的细粒度特征融合方式进行跨模态特征融合,提升图文匹配效果。
-
公开(公告)号:CN109614520B
公开(公告)日:2021-06-04
申请号:CN201811228936.4
申请日:2018-10-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901
Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。
-
公开(公告)号:CN109614520A
公开(公告)日:2019-04-12
申请号:CN201811228936.4
申请日:2018-10-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901
Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。
-
公开(公告)号:CN119583094A
公开(公告)日:2025-03-07
申请号:CN202411416960.6
申请日:2024-10-11
Applicant: 中国科学院信息工程研究所
Abstract: 本发明属于网络流量领域,涉及一种面向网络流量分析检测的行业大模型构建方法及系统。该方法包括:获取网络流量日志数据,并构建IP情报库和安全漏洞库;根据网络流量日志数据、IP情报库和安全漏洞库生成事件详情、事件判别和处置建议,通过合并事件详情、事件判别和处置建议形成流量研判报告,将流量研判报告与网络流量日志数据构成预训练数据集;利用预训练数据集和Lora技术微调语言大模型,生成用于网络流量分析和检测的行业大模型。本发明具备网络流量的自然语言理解和分析能力,能够有效检测和研判异常流量,并自动生成研判报告,为监管人员研判网络攻击提供可靠依据,有效提升网络治理水平。
-
公开(公告)号:CN119383222A
公开(公告)日:2025-01-28
申请号:CN202411256857.X
申请日:2024-09-09
Applicant: 中国科学院信息工程研究所
IPC: H04L67/52 , H04L61/5007 , G06N3/045
Abstract: 本发明公开一种用于强动态场景下的IP定位预测方法,涉及IP定位领域。收集特定IP目标的空间数据后进行数据增强,再进行位置聚合得到IP地理图,进而结合统计特征得到IP空间图。将IP空间图输入预测模型得到IP定位预测结果。所述预测模型基于IP空间图的每一图节点建立空间节点嵌入,根据空间节点嵌入的重要性分配权重得到全局空间图嵌入,再叠加位置编码并进行关联,得到IP时空图嵌入,融合IP时空图嵌入并进行解码得到IP定位预测结果。本发明捕获了目标IP的空间模式和变化趋势,使地理定位系统能够更好地理解和适应网络和地理环境的动态变化,从而保证了在强动态空间场景中的准确性和可用性。
-
公开(公告)号:CN117993507A
公开(公告)日:2024-05-07
申请号:CN202410064061.8
申请日:2024-01-16
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于跨模态预训练模型的多模态知识提取与积累方法及装置。该方法包括:从给定的“问题‑图像”对中提取多模态知识三元组;利用三种损失函数学习多模态知识三元组的表示;利用学习的多模态知识三元组的表示,采用预训练‑微调的策略进行多模态知识的逐步积累,形成多模态知识库;对于给定的问题和图像,利用多模态知识库通过知识检索进行答案预测。本发明用一种新的知识表示学习的框架,可以独立于已有的知识库,通过对VQA样本的观察积累具有复杂关系的多模态知识,并基于积累的知识进行可解释的推理。
-
公开(公告)号:CN117609548A
公开(公告)日:2024-02-27
申请号:CN202311326840.2
申请日:2023-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F16/738 , G06V20/40 , G06F18/22 , G06V10/74 , G06V20/62 , G06V10/25 , G06N3/0455 , G06N3/09 , H04N21/8549
Abstract: 本发明涉及一种基于预训练模型的视频多模态目标要素抽取与视频摘要合成方法及系统。该方法包括:对用户的自定义文稿进行预处理;通过预训练模型提取视频中的关键要素;将用户的自定义文稿中的句子与提取的视频中的关键要素进行匹配;根据匹配的结果自动生成结果视频。本发明能够处理用户提供的自定义文案,并根据文案的不同生成不同的摘要视频结果,在实现关键信息抽取的同时,充分考虑了用户的自定义需求,能够实现多样化剪辑,从而更好地促进信息的检索与传播。
-
公开(公告)号:CN117150069A
公开(公告)日:2023-12-01
申请号:CN202311123143.7
申请日:2023-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/583 , G06V30/19 , G06V30/18 , G06N3/048
Abstract: 本发明提出基于全局与局部语义对比学习的跨模态检索方法及系统,属于信息技术领域,通过独立嵌入模型从给定图像‑文本对提取视觉和文本的局部上下文特征,并输入到上下文对齐模块中获得视觉和文本的全局上下文特征,再据此获得增强的视觉和文本的局部上下文特征和全局上下文特征,进而获得视觉和文本的局部聚合上下文特征,通过特征融合得到视觉和文本的全局融合上下文特征,进而得到给定图像‑文本对的上下文关系级别匹配分数;训练上下文对齐模块,增强独立嵌入模型的表征能力。本发明从全局表征中提取细粒度信息,平衡图文检索的精度和效率,在不损失独立嵌入模型的高效检索特性的情况下提高检索精度。
-
公开(公告)号:CN115412295A
公开(公告)日:2022-11-29
申请号:CN202210871377.9
申请日:2022-07-22
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L43/04 , H04L43/0876 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于大规模预训练的多场景低资源加密流量识别方法和系统。本发明通过自监督学习掩码任务、BURST同源任务以挖掘有效通用加密流量知识,并结合低资源下多场景的微调学习表征每个场景下对应不同类别的加密流量,可以实现高效地在多场景加密流量识别任务中迁移应用,而不依赖明文信息和大量标注样本;同时作为一种端到端方法,无需手动提取特征集。本发明能够解决现有多场景低资源加密流量识别方法存在的特征工程繁杂、受标注样本数量影响大、无法直接迁移到多场景进而导致识别效果受限的问题。
-
公开(公告)号:CN117557803A
公开(公告)日:2024-02-13
申请号:CN202311326846.X
申请日:2023-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06V10/44 , G06V10/82 , G06F40/30 , G06F40/242 , G06N3/0464 , G06N3/045 , G06N3/0895
Abstract: 本发明涉及一种基于跨模态结构一致性和预训练技术的视觉语言对齐方法和系统。该方法包括:采用视觉预训练编码器和语言预训练编码器分别获取图像目标表示和对应的文本单词表示,构建视觉向量表示空间和语言向量表示空间;基于视觉语言共线关系的结构一致性,分阶段由粗到细地将视觉向量表示空间映射到语言向量表示空间,从而将图像目标表示与相应的文本单词表示进行对齐。本发明从人类的认知角度的多模态共现结构一致性出发,分三阶段从粗到细将视觉表示对齐到了上下文一致的语言表示,最终得到一个简单的线性映射层,可以很容易地和各种视觉语言结合,将视觉表示对齐到相应的语言表示,提升了模型细粒度关联视觉语言信息的能力。
-
-
-
-
-
-
-
-
-