一种面向文本和图像的跨媒体检索方法及电子装置

    公开(公告)号:CN112000818B

    公开(公告)日:2023-05-12

    申请号:CN202010663328.7

    申请日:2020-07-10

    Abstract: 本发明提供一种面向文本和图像的跨媒体检索方法及电子装置,提取一设定长度语音信息的g维MFCC特征,并将长度为m的g维MFCC特征转换为一维语音特征;对一设定文本进行编码,获取词级别文本表示,并将词级别文本表示中每一个词与一维语音特征进行拼接,得到语音引导文本特征;提取每一图片的区域特征,计算区域特征与语音引导文本特征的相似性分数,判断该图片是否包含设定语音信息及设定文本信息,得到检索结果。本发明利用语音信息的停顿信息,以及语音信息与图像和文本间的关联关系来提升图像‑文本匹配任务的性能,建模了融合语音信息的文本特征表示,引入基于局部注意力机制的细粒度特征融合方式进行跨模态特征融合,提升图文匹配效果。

    一种面向多模式图匹配的并行加速方法

    公开(公告)号:CN109614520B

    公开(公告)日:2021-06-04

    申请号:CN201811228936.4

    申请日:2018-10-22

    Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。

    一种面向多模式图匹配的并行加速方法

    公开(公告)号:CN109614520A

    公开(公告)日:2019-04-12

    申请号:CN201811228936.4

    申请日:2018-10-22

    Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。

    一种面向网络流量分析检测的行业大模型构建方法及系统

    公开(公告)号:CN119583094A

    公开(公告)日:2025-03-07

    申请号:CN202411416960.6

    申请日:2024-10-11

    Abstract: 本发明属于网络流量领域,涉及一种面向网络流量分析检测的行业大模型构建方法及系统。该方法包括:获取网络流量日志数据,并构建IP情报库和安全漏洞库;根据网络流量日志数据、IP情报库和安全漏洞库生成事件详情、事件判别和处置建议,通过合并事件详情、事件判别和处置建议形成流量研判报告,将流量研判报告与网络流量日志数据构成预训练数据集;利用预训练数据集和Lora技术微调语言大模型,生成用于网络流量分析和检测的行业大模型。本发明具备网络流量的自然语言理解和分析能力,能够有效检测和研判异常流量,并自动生成研判报告,为监管人员研判网络攻击提供可靠依据,有效提升网络治理水平。

    一种用于强动态场景下的IP定位预测方法

    公开(公告)号:CN119383222A

    公开(公告)日:2025-01-28

    申请号:CN202411256857.X

    申请日:2024-09-09

    Abstract: 本发明公开一种用于强动态场景下的IP定位预测方法,涉及IP定位领域。收集特定IP目标的空间数据后进行数据增强,再进行位置聚合得到IP地理图,进而结合统计特征得到IP空间图。将IP空间图输入预测模型得到IP定位预测结果。所述预测模型基于IP空间图的每一图节点建立空间节点嵌入,根据空间节点嵌入的重要性分配权重得到全局空间图嵌入,再叠加位置编码并进行关联,得到IP时空图嵌入,融合IP时空图嵌入并进行解码得到IP定位预测结果。本发明捕获了目标IP的空间模式和变化趋势,使地理定位系统能够更好地理解和适应网络和地理环境的动态变化,从而保证了在强动态空间场景中的准确性和可用性。

    基于全局与局部语义对比学习的跨模态检索方法及系统

    公开(公告)号:CN117150069A

    公开(公告)日:2023-12-01

    申请号:CN202311123143.7

    申请日:2023-09-01

    Abstract: 本发明提出基于全局与局部语义对比学习的跨模态检索方法及系统,属于信息技术领域,通过独立嵌入模型从给定图像‑文本对提取视觉和文本的局部上下文特征,并输入到上下文对齐模块中获得视觉和文本的全局上下文特征,再据此获得增强的视觉和文本的局部上下文特征和全局上下文特征,进而获得视觉和文本的局部聚合上下文特征,通过特征融合得到视觉和文本的全局融合上下文特征,进而得到给定图像‑文本对的上下文关系级别匹配分数;训练上下文对齐模块,增强独立嵌入模型的表征能力。本发明从全局表征中提取细粒度信息,平衡图文检索的精度和效率,在不损失独立嵌入模型的高效检索特性的情况下提高检索精度。

    一种基于跨模态结构一致性和预训练技术的视觉语言对齐方法和系统

    公开(公告)号:CN117557803A

    公开(公告)日:2024-02-13

    申请号:CN202311326846.X

    申请日:2023-10-13

    Abstract: 本发明涉及一种基于跨模态结构一致性和预训练技术的视觉语言对齐方法和系统。该方法包括:采用视觉预训练编码器和语言预训练编码器分别获取图像目标表示和对应的文本单词表示,构建视觉向量表示空间和语言向量表示空间;基于视觉语言共线关系的结构一致性,分阶段由粗到细地将视觉向量表示空间映射到语言向量表示空间,从而将图像目标表示与相应的文本单词表示进行对齐。本发明从人类的认知角度的多模态共现结构一致性出发,分三阶段从粗到细将视觉表示对齐到了上下文一致的语言表示,最终得到一个简单的线性映射层,可以很容易地和各种视觉语言结合,将视觉表示对齐到相应的语言表示,提升了模型细粒度关联视觉语言信息的能力。

Patent Agency Ranking