-
公开(公告)号:CN116668076A
公开(公告)日:2023-08-29
申请号:CN202310469493.2
申请日:2023-04-27
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种基于异质图鲁棒对抗学习的恶意域名检测方法和装置。所述方法包括:将DNS场景建模为一个原始异质图;其中,所述原始异质图中的节点包括:域名、客户端和IP地址;对原始异质图进行攻击注入,以得到若干个受攻击图;基于DoDe‑CL模型和多层感知机,计算原始异质图和受攻击图中的域名嵌入表示后,对同一域名进行域名嵌入表示组合,并根据组合后的域名嵌入表示,得到所述DNS场景中的恶意域名检测结果。本发明可以提升模型面对基于异质图的攻击时的鲁棒性。
-
公开(公告)号:CN116628303A
公开(公告)日:2023-08-22
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN113472742B
公开(公告)日:2022-09-27
申请号:CN202110588732.7
申请日:2021-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L41/142 , G06K9/62 , G06N3/04
Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。
-
公开(公告)号:CN109753589A
公开(公告)日:2019-05-14
申请号:CN201811432008.X
申请日:2018-11-28
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/904
Abstract: 本发明公开了一种基于图卷积网络的图可视化方法,其步骤包括:1)对于目标领域的网络G=(V,E),将网络G中的节点嵌入到一个低维欧式空间中,得到网络G的低维嵌入向量;所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息;其中,V是节点集合,E是边集合;2)将所述低维嵌入向量构造成一张K近邻图,即KNN图;3)基于概率模型将所述KNN图在二维空间中绘制出来。本发明学习到的嵌入向量同时保留了节点的结构信息和特征信息,可以对可视化结果进行粒度化调整。
-
公开(公告)号:CN105630884B
公开(公告)日:2019-03-08
申请号:CN201510957634.0
申请日:2015-12-18
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9537 , G06F16/35
Abstract: 本发明公开了一种微博热点事件的地理位置发现方法。本方法为:1)基于行政区规划地理词词典及中文简称词的命名规则构建一简称词词典,然后将该简称词词典与全称词词典进行关联;2)根据事件关键字,获取包含该事件关键字的微博信息;3)对获取的微博信息进行分词处理,得到该微博的分词集合,然后判断该分词集合中每一名词是否在该简称词词典或全称词词典中,如果存在则将该名词作为候选地理位置词保留;当该微博中出现多个候选地理位置词时,则选取一候选地理位置词作为该微博的地点;4)获取确定的每一地点的地理位置经纬度信息,然后对得到的地理位置经纬度信息进行聚类,根据聚类中心判断出事件爆发地点。本方法可更好的了解突发事件。
-
公开(公告)号:CN117909438B
公开(公告)日:2025-05-09
申请号:CN202410024769.0
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F16/334 , G06F40/30 , G06N3/0455
Abstract: 本发明公开了一种文档的篇章级事件论元抽取方法、系统及介质,属于文本信息抽取领域,针对上下文一致性检索、模式一致性检索和自适应混合检索这三种检索方式,通过构建基于T5模型的检索增强生成模型,执行对应的检索增强策略,可以回忆起有助于演示模型应该如何解决任务的样例。其中,本发通过自适应混合检索增强范式来生成参考向量作为深度线索,能够提高模型的类比能力。
-
公开(公告)号:CN116628303B
公开(公告)日:2025-03-14
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/353 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN118760772A
公开(公告)日:2024-10-11
申请号:CN202410736212.X
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。
-
公开(公告)号:CN108492200B
公开(公告)日:2022-06-17
申请号:CN201810124041.X
申请日:2018-02-07
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/00 , G06F16/9535 , G06N3/04
Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。
-
公开(公告)号:CN110688479A
公开(公告)日:2020-01-14
申请号:CN201910764862.4
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06F40/295
Abstract: 本发明公开了一种用于生成式摘要的评估方法及排序网络。本发明从三个方面来评估摘要质量:第一,运用语言模型来评估语言的流畅度;第二,使用相似度模型评估文本和摘要之间的语义相关性;第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。本发明从摘要的语言流畅性、摘要与原文的相关性以及摘要所包含的信息量等多个方面来综合评估摘要的质量,大大提高了评估的准确性。
-
-
-
-
-
-
-
-
-