一种基于密文的安全全文索引和检索系统

    公开(公告)号:CN101520800B

    公开(公告)日:2010-09-01

    申请号:CN200910061325.X

    申请日:2009-03-27

    Abstract: 本发明公开一种基于密文的安全全文索引和检索系统。系统中,密文索引库包含密文词条倒排索引和内部文档对象集合;密文文档库负责存储和管理密态XML文档;分词加密服务器将明文文本进行中文分词并逐条加密;密文全文索引服务器将原始明文文档规范为XML文档,加密存储到密文文档库,并结合文档元信息在密文索引库中创建相应内部文档对象,再利用密文词条为其构建密文倒排索引;密文全文检索服务器利用用户权限信息和密文词条检索密文索引库得到内部文档对象集合,根据其指针从密文文档库获取相应密态XML文档结果集,解密后返回给用户。本发明基于满足密文全文索引特殊要求的中文分词方法、安全高效的索引结构和检索机制,实现了结合访问控制策略的密文全文检索,具有索引过程安全高效、检索过程检索词不脱密、在密文环境中查全率和查准率高等特点。

    一种基于分块组织的密文索引结构及其管理方法

    公开(公告)号:CN101655858A

    公开(公告)日:2010-02-24

    申请号:CN200910063738.1

    申请日:2009-08-26

    Abstract: 本发明公开了一种基于分块组织的密文索引结构及其管理方法。针对分块的密文索引结构,在创建索引时,首先是采用基于合并的索引创建方式创建明文索引,然后统一对明文索引进行分块加密。基于密文索引的维护机制则是分为索引中文档的添加、删除、修改。文档的添加主要分为二种情况,批量添加和少量添加,批量添加通过在磁盘上创建临时索引,少量添加则是通过创建内存索引。文档的删除首先为删除文档做一个删除标记,等到适当的时机文档进行统一删除。索引修改则是先删除原始文档,然后重新添加新文档。密钥管理策略是对索引加密密钥进行分层管理以及通过时间戳机制来实现密钥的更新。基于索引的访问控制策略是将访问控制信息整合到索引当中,实现文档级粒度的访问控制。

    中文自然语言的SQL语句生成模型的构建方法及应用

    公开(公告)号:CN114020768B

    公开(公告)日:2024-07-05

    申请号:CN202111191677.4

    申请日:2021-10-13

    Abstract: 本发明公开了一种中文自然语言的SQL语句生成模型的构建方法及应用,包括:S1、搭建SQL语句生成模型;S2、将采集到训练集中的中文自然语言问题和相关数据库模式作为输入,对应的正确SQL语句作为输出,通过最小化SQL语句生成模型生成的SQL语句与正确SQL语句之间的差异,训练SQL语句生成模型。本发明通过结合不同数据列的类型信息,捕捉中文自然语言问题与数据库模式之间的对齐关系、隐含的指代关系,并通过有向图的方式对数据库模式显式定义的关系和自然语言问题与数据库模式间的链接关系进行了表示;并通过综合考虑非结构化数据和结构化数据之间的特点,将语义特征和关系特征结合起来联合编码,大大提高了SQL语句生成模型的准确率。

    一种基于深度学习的人物关系图谱构建方法及系统

    公开(公告)号:CN111538849B

    公开(公告)日:2023-04-07

    申请号:CN202010358399.6

    申请日:2020-04-29

    Abstract: 本发明公开了一种基于深度学习的人物关系图谱构建方法及系统,所属方法包括:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;设置模型超参数,结合预处理后的样本数据建立深度学习模型;定义具有层次化的人物信息模板,并基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;利用填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。如此,本发明能够解决多值人物属性以及存在于分散文本的人物关系发现与提取问题,进而提高了人物关系图谱构建的准确性和信息丰富度。

    一种基于社交时空信息与用户偏好的连续兴趣点推荐方法

    公开(公告)号:CN115422441A

    公开(公告)日:2022-12-02

    申请号:CN202210962016.5

    申请日:2022-08-11

    Abstract: 本发明公开了一种基于社交时空信息与用户偏好的连续兴趣点推荐方法及系统。该方法包括:获取用户签到序列中用户的长期偏好特征和短期偏好特征;获取用户签到序列中每个位置上的地理空间特征;获取用户签到序列中每个位置上的用户社交信息特征;将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。解决了签到数据稀疏性,元信息利用广度不足和冷用户推荐不准确的技术问题,实现对用户签到序列进行了层次化特征提取,增加了地理空间特征,增强了用户社交信息特征,全面学习用户的行为特点,准确推荐的下一个兴趣点,优化用户的使用感受。

    一种基于对抗攻击算法的加密流量分析防御方法和系统

    公开(公告)号:CN113938291B

    公开(公告)日:2022-12-02

    申请号:CN202111033459.8

    申请日:2021-09-03

    Abstract: 本发明公开一种基于对抗攻击算法的加密流量分析防御方法和系统,属于网络信息安全领域。包括:S1.将网站流量数据样本中每个会话的网站流量数据抽象压缩为流量突发序列并作为样本,得到样本集,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量;S2.对于样本集中的每个样本,从样本集中随机抽取与当前样本标签不同的多个样本作为目标样本池,从目标样本池中选取距离当前样本最近的目标样本;S3.对当前样本添加扰动使其逼近目标样本,对填充扰动后样本判断分类误判概率是否达到阈值,若是,结束,否则,进入步骤S2。本发明保证网络数据的完整性和可靠性,同时保证数据的扰动尽可能小以减小防御策略的负载消耗。

    基于云链融合的分布式数据存储管理方法、装置及系统

    公开(公告)号:CN114282272A

    公开(公告)日:2022-04-05

    申请号:CN202111589835.1

    申请日:2021-12-23

    Abstract: 本发明公开了一种基于云链融合的分布式数据存储管理方法,属于数据管理技术领域,包括:数据分类存储步骤和数据访问步骤,其中数据分类存储步骤包括:(S1)在原始数据上传时,根据数据所有者预先制定的数据分类策略,确定待上传的原始数据所属的数据域;数据分类策略用于根据数据属性确定数据在云端所属的数据域;一个数据所有者存储在一个云计算平台中的同类原始数据信息属于同一个数据域;(S2)将原始数据存储至数据域所对应的云计算平台,并生成相应的关键元数据;关键元数据用于记录原始数据在云端的定位信息;(S3)将所生成的关键元数据存储到区块链上。本发明能够克服对单一云服务提供商的依赖,提高多源异构数据存储的安全性。

    中文自然语言的SQL语句生成模型的构建方法及应用

    公开(公告)号:CN114020768A

    公开(公告)日:2022-02-08

    申请号:CN202111191677.4

    申请日:2021-10-13

    Abstract: 本发明公开了一种中文自然语言的SQL语句生成模型的构建方法及应用,包括:S1、搭建SQL语句生成模型;S2、将采集到训练集中的中文自然语言问题和相关数据库模式作为输入,对应的正确SQL语句作为输出,通过最小化SQL语句生成模型生成的SQL语句与正确SQL语句之间的差异,训练SQL语句生成模型。本发明通过结合不同数据列的类型信息,捕捉中文自然语言问题与数据库模式之间的对齐关系、隐含的指代关系,并通过有向图的方式对数据库模式显式定义的关系和自然语言问题与数据库模式间的链接关系进行了表示;并通过综合考虑非结构化数据和结构化数据之间的特点,将语义特征和关系特征结合起来联合编码,大大提高了SQL语句生成模型的准确率。

    一种基于对抗攻击算法的加密流量分析防御方法和系统

    公开(公告)号:CN113938291A

    公开(公告)日:2022-01-14

    申请号:CN202111033459.8

    申请日:2021-09-03

    Abstract: 本发明公开一种基于对抗攻击算法的加密流量分析防御方法和系统,属于网络信息安全领域。包括:S1.将网站流量数据样本中每个会话的网站流量数据抽象压缩为流量突发序列并作为样本,得到样本集,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量;S2.对于样本集中的每个样本,从样本集中随机抽取与当前样本标签不同的多个样本作为目标样本池,从目标样本池中选取距离当前样本最近的目标样本;S3.对当前样本添加扰动使其逼近目标样本,对填充扰动后样本判断分类误判概率是否达到阈值,若是,结束,否则,进入步骤S2。本发明保证网络数据的完整性和可靠性,同时保证数据的扰动尽可能小以减小防御策略的负载消耗。

    一种用户侧流量数据分析的网站去匿名方法和系统

    公开(公告)号:CN113938290A

    公开(公告)日:2022-01-14

    申请号:CN202111031350.0

    申请日:2021-09-03

    Abstract: 本发明公开一种用户侧流量数据分析的网站去匿名方法和系统,属于网络信息安全领域。包括:将大量带标签的监控网站流量数据样本进行去冗余,将处理好的样本中每个会话的网站流量数据抽象压缩为流量突发序列,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量,将该流量突发序列输入至深度学习模型中提取特征向量,并使用特征向量集构建分类器;从现实环境中采集网站流量数据样本,通过同样的处理方式抽象压缩为流量突发序列后,使用分类器鉴别网站的类别。本发明基于用户侧流量数据进行分析,客户端侧流量数据更加易于获取,更能反映真实的网络环境。采用Brust序列数据代替传统网络数据包,能够有效利用长序列数据的长距离信息。

Patent Agency Ranking