-
公开(公告)号:CN108881369B
公开(公告)日:2020-09-29
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
公开(公告)号:CN108595706A
公开(公告)日:2018-09-28
申请号:CN201810443084.4
申请日:2018-05-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置。该基于主题词类相似性的文档语义表示方法包括:1)使用词向量模型对语料进行训练,得到词向量;2)在语义空间内对词向量进行聚类;3)使用WMD算法计算待表示文档和聚类得到的每个类别之间的距离,将得到的距离作为待表示文档的语义表示。进而,通过计算文档的语义表示向量之间的相似性,实现文档的分类。本发明依据文本的语义信息和单词频率等信息,通过WMD模型计算文本单词和聚类集合之间的转移代价,将文本表示成一个低维稠密、包含语义信息的向量,能更好地表示文本信息,分类任务准确性高,可应用在信息检索、文本分类等自然语言处理任务中。
-
公开(公告)号:CN108595706B
公开(公告)日:2022-05-24
申请号:CN201810443084.4
申请日:2018-05-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置。该基于主题词类相似性的文档语义表示方法包括:1)使用词向量模型对语料进行训练,得到词向量;2)在语义空间内对词向量进行聚类;3)使用WMD算法计算待表示文档和聚类得到的每个类别之间的距离,将得到的距离作为待表示文档的语义表示。进而,通过计算文档的语义表示向量之间的相似性,实现文档的分类。本发明依据文本的语义信息和单词频率等信息,通过WMD模型计算文本单词和聚类集合之间的转移代价,将文本表示成一个低维稠密、包含语义信息的向量,能更好地表示文本信息,分类任务准确性高,可应用在信息检索、文本分类等自然语言处理任务中。
-
公开(公告)号:CN109062899B
公开(公告)日:2021-10-15
申请号:CN201810857156.X
申请日:2018-07-31
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F40/284
Abstract: 本发明公开了一种基于词性标注的文档相似性度量方法。本方法为:1)对于两待分析的文档doc1、doc2,使用词性标注工具对文档doc1、doc2进行词性标注,得到文档的词性标签,对词性标签进行编码,得到词性标签向量;2)根据文档doc1、doc2的词性标签分布和单词分布度量两文档doc1、doc2之间的距离;3)根据两文档doc1、doc2之间的距离确定两文档doc1、doc2之间的相似度。本发明使得文本之间的距离度量更加精确,可以被应用在信息检索、文本分类等自然语言处理任务中,能够大大提高文本分类任务的准确率。
-
公开(公告)号:CN104111983A
公开(公告)日:2014-10-22
申请号:CN201410306336.0
申请日:2014-06-30
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30557
Abstract: 本发明涉及一种开放式的多源数据采集系统及方法,包括用于根据需要创建采集任务,配置采集任务信息,生成相应的数据采集接口规则的任务管理模块;用于加载数据采集接口规则,执行处于激活状态的采集任务,相应的采集任务进行数据源监听并采集数据,将接采集的数据按照统一格式进行封装,并发送给数据存储模块的任务执行模块;用于存储数据输出模块输出的数据的数据存储模块;本发明覆盖了比较全面的数据源采集类型,支持目前通用的数据采集方式,支持数据采集接口的动态扩展和多个数据源的并行采集,当有新的数据源接入时,只需要配置数据采集任务信息,不需要部署采集代理和数据模式转换工具即可轻松实现对新数据源的数据采集。
-
公开(公告)号:CN108519983A
公开(公告)日:2018-09-11
申请号:CN201810113977.2
申请日:2018-02-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。
-
公开(公告)号:CN104111983B
公开(公告)日:2017-12-19
申请号:CN201410306336.0
申请日:2014-06-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种开放式的多源数据采集系统及方法,包括用于根据需要创建采集任务,配置采集任务信息,生成相应的数据采集接口规则的任务管理模块;用于加载数据采集接口规则,执行处于激活状态的采集任务,相应的采集任务进行数据源监听并采集数据,将接采集的数据按照统一格式进行封装,并发送给数据存储模块的任务执行模块;用于存储数据输出模块输出的数据的数据存储模块;本发明覆盖了比较全面的数据源采集类型,支持目前通用的数据采集方式,支持数据采集接口的动态扩展和多个数据源的并行采集,当有新的数据源接入时,只需要配置数据采集任务信息,不需要部署采集代理和数据模式转换工具即可轻松实现对新数据源的数据采集。
-
公开(公告)号:CN106803035A
公开(公告)日:2017-06-06
申请号:CN201611079933.X
申请日:2016-11-30
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/45 , G06F21/31 , G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明公开了一种基于用户名信息的密码猜测集生成方法及密码破解方法。本发明的密码破解方法为:1)对泄漏数据训练集中的用户名、密码分别进行分词和语义结构标注,计算用户名、密码的语义相似性;其中,所述语义相似性包括语义结构相似性和语义片段相似性;2)将该语义相似性应用到PCFGs语法中,即基于语义相似性构建PCFGs语法;3)根据步骤2)构建的PCFGs语法,按照概率降序生成密码猜测集;4)根据该密码猜测集进行密码破解。本发明利用用户名和密码的片段相似性和结构相似性,理解密码的构成语义,从而生成密码猜测集,提高密码破解效率。
-
公开(公告)号:CN104022899A
公开(公告)日:2014-09-03
申请号:CN201410231273.7
申请日:2014-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L12/24
Abstract: 本发明涉及一种网络管理系统的三维评估方法,包括对当前的网络状况和管理系统的需求进行分析;根据前面的分析结果,构建可动态可配置的评估模型指标体系;采用评估模型对要评估的管理系统进行模拟评估;如果通过则部署该管理系统;如果未通过,重新对评估模型进行修正;在管理系统部署后,对要评估的管理系统进行实践评估,如果未通过,重新对评估模型进行修正;如果通过,得出评估结果,并给出该管理系统部署后对网络中各方实体的影响,提供改进部署方法的建议;本发明可以对现有网络管理系统进行全面的评估,找出其中存在的缺陷并提出科学有效的部署整改意见,还可以应付大量网络设备的评估量,另外该评估方法具有很强的灵活性和高度的扩展性。
-
公开(公告)号:CN103036743A
公开(公告)日:2013-04-10
申请号:CN201210555371.7
申请日:2012-12-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种窃密木马的TCP心跳行为的检测方法,包括:步骤1,抓取网络数据包,还原成TCP数据流;步骤2,检测是否有TCP保活心跳行为;步骤3,检测是否有TCP连接内心跳行为;步骤4,检测是否有TCP连接级心跳行为:步骤5,对检测出的窃密木马心跳行为进行误判检测。本发明基于网络数据包大小、方向和时间等特征,能计算出心跳的周期及其波动的范围,方法简单,检测结果准确全面,能运用在实时检测窃密木马的系统中,具有较好的检测效果。
-
-
-
-
-
-
-
-
-