-
公开(公告)号:CN113556317A
公开(公告)日:2021-10-26
申请号:CN202110633083.8
申请日:2021-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供了一种基于网络流结构特征融合的异常流量检测方法及装置,包括:将待检测的网络流输入至预设的预判器,得到对应的判断结果;若判断结果为待检测的网络流能够仅依靠网络流结构特征进行检测,则将待检测的网络流输入至预设的网络流结构特征检测器进行检测;若判断结果为待检测的网络流不能够仅依靠网络流结构特征进行检测,则将待检测的网络流输入至预设的全特征检测器进行检测。本发明针对网络流结构信息进行表示,并提取网络流结构特征,解决了缺乏网络流结构信息的问题,然后通过预判式特征融合实现网络流特征与网络流结构特征融合,从而提高检测率、降低误报率。
-
公开(公告)号:CN111680120A
公开(公告)日:2020-09-18
申请号:CN202010367249.1
申请日:2020-04-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/953 , G06K9/62
Abstract: 本发明实施例提供了一种新闻类别检测方法及系统,所述方法包括:获取待检测新闻的内容文本和社会属性文本;将内容文本以及社会属性文本输入至新闻类别粗检测模型,得到新闻类别粗检测模型输出的待检测新闻的第一类类别文本。所述方法还包括:将所述第一类类别文本、所述内容文本以及所述社会属性文本输入至新闻类别细检测模型,得到所述新闻类别细检测模型输出的所述待检测新闻的第二类类别文本。通过新闻类别粗检测模型以及细检测模型,实现特征提取、特征融合,并在特征融合时考虑到社会属性文本,使融合结果更加准确,也使得基于融合结果确定的检测结果更准确。
-
公开(公告)号:CN118155233A
公开(公告)日:2024-06-07
申请号:CN202410286720.2
申请日:2024-03-13
Applicant: 中国科学院信息工程研究所
IPC: G06V30/413 , G06N3/042 , G06V30/19 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种基于分层图注意力神经网络的文档分类方法及装置,所述方法包括:基于待分类文档获取关键词特征图和关键字特征图;基于分层图注意力神经网络对所述关键词特征图和所述关键字特征图进行特征融合,得到融合后的文本特征向量;将所述文本特征向量输入所述分层图注意力神经网络中,获取所述分层图注意力神经网络输出的分类结果,所述分类结果用于指示所述待分类文档的类别标签。本申请实施例提供的基于分层图注意力神经网络的文档分类方法及装置,通过获取待分类文档中的关键词特征图和关键字特征图,并基于设计的分层图注意力网络进行文本表示学习,能够提高分类结果的准确率。
-
公开(公告)号:CN116431802A
公开(公告)日:2023-07-14
申请号:CN202111653782.5
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F40/284 , G06F18/214 , G06F18/241
Abstract: 本发明提供一种单词识别方法、装置、电子设备及存储介质,该方法包括:将待识别文本输入单词识别模型;利用所述单词识别模型输出所述待识别文本中各个单词的单词类别,所述单词类别包括方面词、方面词子词、观点词、其他词和其他子词中的至少一个;其中,所述单词识别模型为根据多个训练样本训练得到。本发明通过多个训练样本训练得到单词识别模型,并利用该单词识别模型输出得到待识别文本中各个单词的单词类型,能准确识别出待识别文本中各个单词的单词类型,进而能准确得知待识别文本中哪些单词是方面词和观点词。
-
公开(公告)号:CN111680120B
公开(公告)日:2022-06-03
申请号:CN202010367249.1
申请日:2020-04-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/953 , G06K9/62
Abstract: 本发明实施例提供了一种新闻类别检测方法及系统,所述方法包括:获取待检测新闻的内容文本和社会属性文本;将内容文本以及社会属性文本输入至新闻类别粗检测模型,得到新闻类别粗检测模型输出的待检测新闻的第一类类别文本。所述方法还包括:将所述第一类类别文本、所述内容文本以及所述社会属性文本输入至新闻类别细检测模型,得到所述新闻类别细检测模型输出的所述待检测新闻的第二类类别文本。通过新闻类别粗检测模型以及细检测模型,实现特征提取、特征融合,并在特征融合时考虑到社会属性文本,使融合结果更加准确,也使得基于融合结果确定的检测结果更准确。
-
公开(公告)号:CN112487422B
公开(公告)日:2023-04-04
申请号:CN202011173874.9
申请日:2020-10-28
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06F40/216
Abstract: 本发明实施例提供一种恶意文档检测方法、装置、电子设备及存储介质,该方法包括:对待检测文档进行分析,得到文档特征信息;将所述文档特征信息输入预设恶意文档检测模型,得到检测结果信息;其中,所述预设恶意文档检测模型通过带恶意标签的样本文档特征信息和无标签的样本文档特征信息训练得到的。通过待检测文档的特点,分别提取了文档特征结构信息和文档统计特征信息得到文档特征信息,然后选取了一种半监督学习方法,构建多棵决策树来进行恶意文档检测,多棵决策树集成的思想提高检测准确率而节省了大量的数据标注工作,从而更符合真实应用场景,最终更好的实现恶意文档检测。
-
公开(公告)号:CN113556317B
公开(公告)日:2022-10-11
申请号:CN202110633083.8
申请日:2021-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供了一种基于网络流结构特征融合的异常流量检测方法及装置,包括:将待检测的网络流输入至预设的预判器,得到对应的判断结果;若判断结果为待检测的网络流能够仅依靠网络流结构特征进行检测,则将待检测的网络流输入至预设的网络流结构特征检测器进行检测;若判断结果为待检测的网络流不能够仅依靠网络流结构特征进行检测,则将待检测的网络流输入至预设的全特征检测器进行检测。本发明针对网络流结构信息进行表示,并提取网络流结构特征,解决了缺乏网络流结构信息的问题,然后通过预判式特征融合实现网络流特征与网络流结构特征融合,从而提高检测率、降低误报率。
-
公开(公告)号:CN112487422A
公开(公告)日:2021-03-12
申请号:CN202011173874.9
申请日:2020-10-28
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06F40/216
Abstract: 本发明实施例提供一种恶意文档检测方法、装置、电子设备及存储介质,该方法包括:对待检测文档进行分析,得到文档特征信息;将所述文档特征信息输入预设恶意文档检测模型,得到检测结果信息;其中,所述预设恶意文档检测模型通过带恶意标签的样本文档特征信息和无标签的样本文档特征信息训练得到的。通过待检测文档的特点,分别提取了文档特征结构信息和文档统计特征信息得到文档特征信息,然后选取了一种半监督学习方法,构建多棵决策树来进行恶意文档检测,多棵决策树集成的思想提高检测准确率而节省了大量的数据标注工作,从而更符合真实应用场景,最终更好的实现恶意文档检测。
-
-
-
-
-
-
-