-
公开(公告)号:CN119808124A
公开(公告)日:2025-04-11
申请号:CN202411904010.8
申请日:2024-12-23
Applicant: 中国科学院信息工程研究所
IPC: G06F21/60 , H04L9/40 , G06F16/93 , G06N3/0455 , G06F16/9038
Abstract: 本发明公开了一种上下文增强的语义可搜索加密方法及系统。本方法为:1)使用已标注的查询‑文档对数据训练所选模型,得到最优模型并部署在客户端;2)客户端生成密钥,利用最优模型为待上传的文档生成文档向量表示hd,然后利用密钥对hd进行加密,得到加密后的文档向量并上传至服务器端;3)服务器端存储文档向量并构建对应的索引I;4)客户端通过最优模型对输入的查询生成查询向量表示hq,然后使用密钥对hq进行加密,得到最终加密后的查询陷门Tq并上传至服务器端;5)服务器端计算查询陷门Tq与索引I之间的相似度分数,选择分数最高的前k个结果返回给客户端。本发明不仅保证了搜索的准确率,而且提高了数据安全性。
-
公开(公告)号:CN116257523A
公开(公告)日:2023-06-13
申请号:CN202310096644.4
申请日:2023-02-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/23 , G06F16/2458 , G06F3/06
Abstract: 本发明公开一种基于非易失存储器的列式存储索引方法及装置,涉及计算机领域,本发明针对指标列实时更新,通过在NVM中建立缓存池,利用NVM的特点,通过两阶段批量更新,构建Main和Delta结构,Main包括多个Segment,每个Segment包含元数据信息和数据信息;Delta包括两个Delta文件,更新时进行交替;在内存中为Delta文件构建Bloom Filter进行更新数据的查询和判断。针对指标列在传统段合并时造成严重写放大的问题,本发明在创建索引时用元数据信息合并来替代传统的列存索引合并,从而在保证读写性能不下降的情况下,减少内存空间的占用以及读写放大。针对低基数维度列,对其创建倒排索引,大幅减少内存空间占用并提升等值查询性能。
-
公开(公告)号:CN103399894A
公开(公告)日:2013-11-20
申请号:CN201310311824.6
申请日:2013-07-23
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种基于共享存储池的分布式事务处理方法,包括:基于哈希将分布式文件系统目录全路径映射到元数据服务器;从需参与分布式事务的元数据服务器集合中指定一个协调器和多个参与器;元数据服务器评估其需要完成的分布式事务操作,若不能完成向协调器汇报“终止”,否则汇报“提交”并锁定资源;协调器根据参与器汇报结果向共享存储池的全局日志中写入“提交”或“终止”,并通知参与器;参与器执行分布式事务操作或者取消锁定资源;当有协调器或参与器故障时,第一个从共享存储池中检查分布式事务状态的参与器或协调器将分布式事务的状态设为“终止”。本发明解决了分布式文件系统中元数据服务在可扩展环境下的快速事务处理问题。
-
公开(公告)号:CN119127867A
公开(公告)日:2024-12-13
申请号:CN202410935756.9
申请日:2024-07-12
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/23 , G06F16/2453 , G06F16/245
Abstract: 本发明公开一种使用底层信息建立查询索引的LSM‑Tree键值存储系统,属于数据存储技术领域。该系统利用LSM‑Tree的底层SSTable边界为索引键,通过压缩过程遍历生成的SSTables中的所有键值对,将与索引键的范围相交的上层SSTable文件编号作为索引值构建索引。本发明加速LSM‑Tree键值存储系统的查询操作。
-
公开(公告)号:CN113434357B
公开(公告)日:2023-04-11
申请号:CN202110534643.4
申请日:2021-05-17
Applicant: 中国科学院信息工程研究所
IPC: G06F11/30 , G06F16/18 , G06F40/216
Abstract: 本发明公开了一种基于序列预测的日志异常检测方法及装置,包括:解析待检测日志序列,得到待检测日志键序列;将待检测日志键序列输入日志异常检测模型,获取日志异常检测结果。本发明通过基于语义的预处理模块构造了日志键的嵌入向量,从周围序列学习目标信息的特性,从而可以保留更多的语义特征,适用于规则多、规模大的平台日志数据,获取更高的检测精度,提高了模型的训练效率。
-
公开(公告)号:CN118502644A
公开(公告)日:2024-08-16
申请号:CN202310110753.7
申请日:2023-02-14
Applicant: 中国科学院信息工程研究所
IPC: G06F3/06
Abstract: 本发明公开一种基于非易失存储器的LSM树的存储组织方法及键值存储系统,涉及计算机领域,通过在内存中建立非易失存储器的活跃区的索引;在非易失存储器中采用单层存储分区域的存储方式,将内存中的数据写入活跃区,写满后再转换为非活跃区,将内存中的索引持久化为非活跃区的索引文件;再将非活跃区的数据文件合并并存储在磁盘上。本发明利用非易失存储器的随机读写和可字节寻址等特性,对现有的LSM树存储引擎进行优化,改善原有结构的写放大和长时间写入后性能下降的问题,提高存储引擎的整体性能。
-
公开(公告)号:CN117435970A
公开(公告)日:2024-01-23
申请号:CN202311219423.8
申请日:2023-09-20
Applicant: 中国科学院信息工程研究所
IPC: G06F18/241 , G06F18/213 , G06F16/901 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/09 , G06N3/0895 , G06N3/096
Abstract: 本发明提供一种通用域自适应的节点分类方法及装置,所述方法包括:构建目标网络的图结构;将图结构输入节点分类模型,以使该节点分类模型基于置信度和熵两个指标来获取每一节点的可迁移性分数;基于可迁移性分数,将对应的节点划入共有集、不确定集或未知集。本发明可以基于不确定性度量以及对比学习,充分学习类别可判别性和领域不变性节点表征,以实现通用域自适应节点分类。
-
公开(公告)号:CN113434357A
公开(公告)日:2021-09-24
申请号:CN202110534643.4
申请日:2021-05-17
Applicant: 中国科学院信息工程研究所
IPC: G06F11/30 , G06F16/18 , G06F40/216
Abstract: 本发明公开了一种基于序列预测的日志异常检测方法及装置,包括:解析待检测日志序列,得到待检测日志键序列;将待检测日志键序列输入日志异常检测模型,获取日志异常检测结果。本发明通过基于语义的预处理模块构造了日志键的嵌入向量,从周围序列学习目标信息的特性,从而可以保留更多的语义特征,适用于规则多、规模大的平台日志数据,获取更高的检测精度,提高了模型的训练效率。
-
公开(公告)号:CN118466842A
公开(公告)日:2024-08-09
申请号:CN202410647110.0
申请日:2024-05-23
Applicant: 中国科学院信息工程研究所
IPC: G06F3/06
Abstract: 本发明公开了基于多层布隆过滤器的存储系统及存储方法,属于数据存储技术领域。本发明在RocksDB的基础上增加多层布隆过滤器仓库、布隆过滤器缓冲区,设计根据文件之间的访问频率差异,给访问频率高的文件分配位数更多的布隆过滤器,给访问频率更低的文件分配位数更少的布隆过滤器,从而在不增加原有内存空间占用的情况下,降低布隆过滤器的误判率,提高系统整体的读性能。
-
公开(公告)号:CN118259830A
公开(公告)日:2024-06-28
申请号:CN202410292960.3
申请日:2024-03-14
Applicant: 中国科学院信息工程研究所
IPC: G06F3/06 , G06F16/901 , G06F9/50
Abstract: 本发明公开了一种基于非易失性内存的动态图存储方法及装置,涉及计算机领域,在DRAM中建立哈希表;在NVM中预分配顶点数组和每个顶点的后缀比特树的根节点,每个顶点的后缀比特树用来存储该顶点的邻接边,后缀比特树的根节点以数组形式预先统一分配内存,顶点数组中的每个顶点和根节点共享同一个索引;在每个邻接边插入之前,先检查该边的源顶点和目的顶点ID的映射关系是否已保存在哈希表中;如果没有,则采取顶点数组中下一个未使用的位置的索引作为顶点ID的哈希值,并将该顶点ID的映射关系保存到哈希表,同时将该顶点存到顶点数组对应的位置。本发明充分利用NVM可字节寻址、非易失性等特点,支持高性能的图更新及图分析能力。
-
-
-
-
-
-
-
-
-