-
公开(公告)号:CN108519983A
公开(公告)日:2018-09-11
申请号:CN201810113977.2
申请日:2018-02-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。
-
公开(公告)号:CN117149795A
公开(公告)日:2023-12-01
申请号:CN202311197360.0
申请日:2023-09-15
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于混合内存的自适应图计算更新方法及系统。本发明首先将有向图数据以出边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的出边数据块;以入边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的入边数据块;构建子图时,直接利用对应入边数据块、出边数据块,从而避免遍历所有数据块;为提高子图数据的访问效率,本发明将图数据的入边数据、出边数据分别存储在两个NUMA节点中;其次,采用一种基于数据驱动的推‑拉自适应的数据更新策略,以优化迭代图计算过程中消息更新的流程。本发明解决了混合内存图计算模型存在的子图构建和更新模式问题,大大提升了图计算的效率。
-
公开(公告)号:CN109145582B
公开(公告)日:2021-07-23
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN108881369A
公开(公告)日:2018-11-23
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
公开(公告)号:CN116484839A
公开(公告)日:2023-07-25
申请号:CN202310312448.6
申请日:2023-03-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/216 , G06F40/284 , G06F40/30 , G06N3/045 , G06N3/08
Abstract: 本发明公开一种基于协同元学习的推理加速方法及装置。所述方法包括:构建推理模型;其中,所述推理模型是每一transformer层之后额外添加一个早退分类器的基于transformer的模型;训练推理模型;其中,所述训练推理模型包括:优化推理模型的初始参数、和将优化参数传入Adam优化器进行梯度更新,以训练早退分类器;使用训练后的推理模型进行任务预测,并基于熵的退出机制输出所述任务的预测结果。本发明可以在保持很小的性能损失的同时提升模型的推理速度。
-
公开(公告)号:CN110866170A
公开(公告)日:2020-03-06
申请号:CN201910992292.4
申请日:2019-10-18
Applicant: 中国科学院信息工程研究所
IPC: G06F16/953 , G06F16/958
Abstract: 本发明公开了一种基于站点质量的Tor暗网服务的重要性评估方法、搜索方法及系统。本方法为:1)构建Tor暗网站点质量评估指标体系,确定评估指标及对应的权重;2)采集目标Tor暗网站点的网页信息,并根据采集信息确定该目标Tor暗网站点的审美评估的评估值、易用性评估的评估值、多媒体支持评估的评估值、内容丰富性评估的评估值;3)根据该目标Tor暗网站点中是否有用户反馈页面、网站是否被Tor2web服务收录以及暗网服务地址是否具有可读性确定该目标Tor暗网站点的网站声誉评估的评估值;4)根据该目标Tor暗网站点的各评估值及对应的权重,确定该目标Tor暗网站点的重要性。本发明能够准确评估站点的质量。
-
公开(公告)号:CN109145582A
公开(公告)日:2019-01-04
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN109062899A
公开(公告)日:2018-12-21
申请号:CN201810857156.X
申请日:2018-07-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/277
Abstract: 本发明公开了一种基于词性标注的文档相似性度量方法。本方法为:1)对于两待分析的文档doc1、doc2,使用词性标注工具对文档doc1、doc2进行词性标注,得到文档的词性标签,对词性标签进行编码,得到词性标签向量;2)根据文档doc1、doc2的词性标签分布和单词分布度量两文档doc1、doc2之间的距离;3)根据两文档doc1、doc2之间的距离确定两文档doc1、doc2之间的相似度。本发明使得文本之间的距离度量更加精确,可以被应用在信息检索、文本分类等自然语言处理任务中,能够大大提高文本分类任务的准确率。
-
公开(公告)号:CN118631477A
公开(公告)日:2024-09-10
申请号:CN202310221375.X
申请日:2023-03-09
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/241 , G06F18/214 , G06N3/04 , G06N3/0985 , G06F16/901
Abstract: 本发明涉及一种基于元学习的小样本恶意域名检测方法及装置。所述方法包括:将DNS场景建模为异质图;所述异质图的节点包括:客户端、域名和IP地址,所述异质图的边包括:客户端查询域名、域名解析为IP地址和域名的规范名称;基于异质图神经网络HGT来学习域名的节点表示,以得到更新后的域名特征向量;使用基于元学习的小样本分类器对所述更新后的域名特征向量进行分类,以得到恶意域名检测结果。本发明可以获取更好的恶意域名检测效果。
-
公开(公告)号:CN114461747A
公开(公告)日:2022-05-10
申请号:CN202210049778.6
申请日:2022-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F40/279 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。
-
-
-
-
-
-
-
-
-