-
公开(公告)号:CN112272121A
公开(公告)日:2021-01-26
申请号:CN202010995988.5
申请日:2020-09-21
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种用于流量监测的效果验证方法及系统。本方法为:1)样本管理模块根据样本测试需求选取协议类型并设置对应的配置项,构造所需样本数据包并上传给服务器;配置项中包含数据包唯一标识信息、测试文件和测试次数;2)服务器根据样本数据包的协议规范发送样本数据包以构造相应流量环境;3)检测处置模块根据该服务器所发送样本数据包的协议类型存储对应样本数据包的标识;以及获取该服务器的全量流量监测日志并解析,根据日志结构区分不同协议以获取对应的数据包标识;4)检测处置模块将从日志解析的数据包标识与存储的样本数据包标识进行匹配,得到该服务器所发送样本数据包的监测结果,该监测结果即为验证结果。
-
公开(公告)号:CN107885705B
公开(公告)日:2020-12-15
申请号:CN201710930206.8
申请日:2017-10-09
Applicant: 中国科学院信息工程研究所
IPC: G06F40/126 , G06F16/93
Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi‑GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。
-
公开(公告)号:CN114461747A
公开(公告)日:2022-05-10
申请号:CN202210049778.6
申请日:2022-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F40/279 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。
-
公开(公告)号:CN108881369B
公开(公告)日:2020-09-29
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
公开(公告)号:CN108595706A
公开(公告)日:2018-09-28
申请号:CN201810443084.4
申请日:2018-05-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置。该基于主题词类相似性的文档语义表示方法包括:1)使用词向量模型对语料进行训练,得到词向量;2)在语义空间内对词向量进行聚类;3)使用WMD算法计算待表示文档和聚类得到的每个类别之间的距离,将得到的距离作为待表示文档的语义表示。进而,通过计算文档的语义表示向量之间的相似性,实现文档的分类。本发明依据文本的语义信息和单词频率等信息,通过WMD模型计算文本单词和聚类集合之间的转移代价,将文本表示成一个低维稠密、包含语义信息的向量,能更好地表示文本信息,分类任务准确性高,可应用在信息检索、文本分类等自然语言处理任务中。
-
公开(公告)号:CN104966051B
公开(公告)日:2018-07-17
申请号:CN201510297257.2
申请日:2015-06-03
Applicant: 中国科学院信息工程研究所
IPC: G06K9/00
Abstract: 本发明公开了一种文档图像的版式识别方法,首先设计了一个版式入库功能,库中会保存版式内容,以及由版式内容相对字高、对齐方式生成的版式序列号,如果一张未知图片经过版式分析,得到的版式序列号与库中的某个版式序列号一样,那么将通过库中的提示信息去提取该未知图片的版式信息。本发明通过高效以及准确的版面分析方法来识别文档图片,尤其适用于中文公文文档图像的版式识别。
-
公开(公告)号:CN104794176A
公开(公告)日:2015-07-22
申请号:CN201510154872.8
申请日:2015-04-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出了一种基于多属性的误发邮件检测方法,包括以下步骤:从标记的多个邮件中提取内容特征属性、社会关系属性及通信行为属性;根据所述内容特征属性、社会关系属性及通信行为属性建立基于SVM分类模型;提取新邮件的内容属性、社会关系属性及通信行为属性,并用所述基于SVM分类模型进行检测,判断所述新邮件是否为误发邮件。本发明从内容特征、社会关系和通信行为等多种属性对用户的通信行为偏差建立通用检测模型,具有实施简单、准确率较高等优点。
-
公开(公告)号:CN104794170A
公开(公告)日:2015-07-22
申请号:CN201510147426.4
申请日:2015-03-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。
-
公开(公告)号:CN103942489A
公开(公告)日:2014-07-23
申请号:CN201410127741.6
申请日:2014-03-31
Applicant: 中国科学院信息工程研究所
IPC: G06F21/55
CPC classification number: G06F21/316 , G06F21/55
Abstract: 本发明涉及一种基于光标隐藏场景的攻击检测方法及系统,其中方法包括步骤:1.监测用户操作行为,发现可疑行为时,发送触发指令;2.通过创建透明窗体置顶的方法实现光标隐藏,使用户进入光标隐藏场景;3.记录用户在光标隐藏场景下对光标的操作数据;4.判断当前数据采集模块记录的操作数据是否达到预设值,或者光标隐藏场景时间值是否达到预设时间值;如果是,执行下一步;否则,执行步骤3;5.特征提取得到光标特征值,生成光标特征向量;6.基于光标特征向量和特征模型文件,进行分类;7.判定用户为正常用户或恶意用户。本发明在保证准确率的前提下,训练数据采集时间短、身份认证时间短。
-
公开(公告)号:CN118886506A
公开(公告)日:2024-11-01
申请号:CN202410921515.9
申请日:2024-07-10
Applicant: 中国科学院信息工程研究所
IPC: G06N5/04 , G06F21/62 , G06F16/176
Abstract: 本发明公开一种用于扩散模型采样的隐私保护推理方法及系统,属于网络安全技术领域。所述方法包括:接收模型拥有方的隐私模型参数数据和用户方预处理后的隐私数据;将隐私模型和隐私数据分别分割为隐私模型秘密分享和隐私数据秘密;三方服务器对模型隐私秘密分享和隐私数据秘密分享进行扩散模型采样并重构秘密分享,所述进行扩散模型采样的过程包括:通过切比雪夫多项式拟合的指数函数ex来替代扩散模型非线性激活函数中的指数运算;将重构的秘密分享返还给用户方,以使用户方获取采样生成图像。本发明通过线性多项式和切比雪夫多项式拟合多种非线性数,提高了隐私扩散模型的计算和通信性能。
-
-
-
-
-
-
-
-
-