一种基于潜层语义分析的安全的文档相似性计算方法和系统

    公开(公告)号:CN108519983A

    公开(公告)日:2018-09-11

    申请号:CN201810113977.2

    申请日:2018-02-05

    Abstract: 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。

    一种基于混合内存的自适应图计算更新方法及系统

    公开(公告)号:CN117149795A

    公开(公告)日:2023-12-01

    申请号:CN202311197360.0

    申请日:2023-09-15

    Abstract: 本发明公开了一种基于混合内存的自适应图计算更新方法及系统。本发明首先将有向图数据以出边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的出边数据块;以入边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的入边数据块;构建子图时,直接利用对应入边数据块、出边数据块,从而避免遍历所有数据块;为提高子图数据的访问效率,本发明将图数据的入边数据、出边数据分别存储在两个NUMA节点中;其次,采用一种基于数据驱动的推‑拉自适应的数据更新策略,以优化迭代图计算过程中消息更新的流程。本发明解决了混合内存图计算模型存在的子图构建和更新模式问题,大大提升了图计算的效率。

    一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统

    公开(公告)号:CN108881369A

    公开(公告)日:2018-11-23

    申请号:CN201810373966.8

    申请日:2018-04-24

    Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。

    基于站点质量的Tor暗网服务的重要性评估方法、搜索方法及系统

    公开(公告)号:CN110866170A

    公开(公告)日:2020-03-06

    申请号:CN201910992292.4

    申请日:2019-10-18

    Abstract: 本发明公开了一种基于站点质量的Tor暗网服务的重要性评估方法、搜索方法及系统。本方法为:1)构建Tor暗网站点质量评估指标体系,确定评估指标及对应的权重;2)采集目标Tor暗网站点的网页信息,并根据采集信息确定该目标Tor暗网站点的审美评估的评估值、易用性评估的评估值、多媒体支持评估的评估值、内容丰富性评估的评估值;3)根据该目标Tor暗网站点中是否有用户反馈页面、网站是否被Tor2web服务收录以及暗网服务地址是否具有可读性确定该目标Tor暗网站点的网站声誉评估的评估值;4)根据该目标Tor暗网站点的各评估值及对应的权重,确定该目标Tor暗网站点的重要性。本发明能够准确评估站点的质量。

    一种基于词性标注的文档相似性度量方法

    公开(公告)号:CN109062899A

    公开(公告)日:2018-12-21

    申请号:CN201810857156.X

    申请日:2018-07-31

    CPC classification number: G06F17/2785 G06F17/277

    Abstract: 本发明公开了一种基于词性标注的文档相似性度量方法。本方法为:1)对于两待分析的文档doc1、doc2,使用词性标注工具对文档doc1、doc2进行词性标注,得到文档的词性标签,对词性标签进行编码,得到词性标签向量;2)根据文档doc1、doc2的词性标签分布和单词分布度量两文档doc1、doc2之间的距离;3)根据两文档doc1、doc2之间的距离确定两文档doc1、doc2之间的相似度。本发明使得文本之间的距离度量更加精确,可以被应用在信息检索、文本分类等自然语言处理任务中,能够大大提高文本分类任务的准确率。

    基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置

    公开(公告)号:CN114461747A

    公开(公告)日:2022-05-10

    申请号:CN202210049778.6

    申请日:2022-01-17

    Abstract: 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。

Patent Agency Ranking