一种用于加速相似文本搜索的新型高效过滤方法

    公开(公告)号:CN115840810A

    公开(公告)日:2023-03-24

    申请号:CN202211539709.X

    申请日:2022-12-02

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于加速相似文本搜索的新型高效过滤方法,包括如下步骤:对于用户提交的文本数据集,区分高低频元素,将低频元素进行哈希建立待搜索数据集;将数据集中的签名按长度分成不同分区,对于每个分区中的签名,使用聚类方法,将新的带搜索数据集中的相似签名,形成不同的簇,保证簇内文本与簇头文本相似度大于设定的相似度阈值;将每个分区中的每个簇中的文本,分别构建完全二叉树;将树过滤器部署到系统中,通过快速过滤来加速相似文本搜索。本发明在使用K最小值技术来估计交集势的基础上,将过滤器按照数据集的分布构建成树状,避免重复遍历,提升检索效率,并避免了过滤的准确性降低问题。

    一种检测衣原体的多肽探针及其应用

    公开(公告)号:CN113801191A

    公开(公告)日:2021-12-17

    申请号:CN202110957415.8

    申请日:2021-08-18

    Applicant: 南京大学

    Abstract: 本发明属于医药生物技术和医学检验技术领域,具体涉及一种检测衣原体的多肽探针及其应用。本发明所述多肽探针是一段肽链Ac‑Lys Asn Ser Ser‑x,Ac代表N末端乙酰化,x代表C末端偶联的用比色分析的对硝基苯胺pNA或荧光化合物7‑氨基‑4‑甲基香豆素AMC或生物素荧光素酶底物生物素Luc化合物。发明所述多肽探针可定量检测衣原体质控物,用于活细胞成像或对衣原体蛋白酶的释放或在胞浆定位或在小动物感染模型上实时监测感染中应用。

    一种在分布式学术数据仓库中检测热点学术研究话题的方法

    公开(公告)号:CN112149416B

    公开(公告)日:2023-08-22

    申请号:CN202010938852.0

    申请日:2020-09-09

    Applicant: 南京大学

    Abstract: 一种在分布式学术数据仓库中检测热点学术研究话题的方法,包括在分布式数据仓库中的数据数据采样压缩编码,传输阶段,以及中央服务器上的数据恢复和检测阶段;数据采样压缩编码对每个从学术文档中提取出的学术词进行多重采样决定是否进入组内每个编码型布谷鸟过滤器,成功采样的词汇将进入数据编码阶段;数据压缩编码阶段负责在每个分布式数据仓库中扫描所有的文档,并利用分词器从文档中提取学术研究词汇;数据传输阶段负责将每个分布式数据仓库中记录压缩数据的编码型布谷鸟过滤器传输至中央服务器;数据恢复和检测阶段是在中央服务器上将从各个分布式数据集上构建起来编码布谷鸟过滤器中解码恢复出原始词汇并估算其热度。

    一种用于加速云平台数据库LSM树查询的高效过滤方法

    公开(公告)号:CN115292308A

    公开(公告)日:2022-11-04

    申请号:CN202210790603.0

    申请日:2022-07-05

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于加速云平台数据库LSM树查询的高效过滤方法,包括如下步骤:将已写入的数据按自身特点划分至互相独立的数据集子块内,为每一个数据集子块单独构建缓存行大小的分块布隆过滤器;结合在本数据块内缺失,但是历史查询频繁的数据,自适应调整已写入的数据的哈希函数集并存入分块哈希表达器;将分块布隆过滤器以及分块哈希映射表共同构成分块哈希自适应过滤器,并部署到系统中。在进行数据是否写入的判断时,采用单指令多数据流技术同时检测一个块内多个比特位。本发明将过滤器按缓存行大小进行分块,并行检测分块内的比特数据,极大提升了查询效率,并结合哈希自适应技术,有效避免了分块带来的准确性降低问题。

    一种检测衣原体的多肽探针及其应用

    公开(公告)号:CN113801191B

    公开(公告)日:2022-05-17

    申请号:CN202110957415.8

    申请日:2021-08-18

    Applicant: 南京大学

    Abstract: 本发明属于医药生物技术和医学检验技术领域,具体涉及一种检测衣原体的多肽探针及其应用。本发明所述多肽探针是一段肽链Ac‑Lys Asn Ser Ser‑x,Ac代表N末端乙酰化,x代表C末端偶联的用比色分析的对硝基苯胺pNA或荧光化合物7‑氨基‑4‑甲基香豆素AMC或生物素荧光素酶底物生物素Luc化合物。发明所述多肽探针可定量检测衣原体质控物,用于活细胞成像或对衣原体蛋白酶的释放或在胞浆定位或在小动物感染模型上实时监测感染中应用。

    一种用于实时入侵检测系统的过滤方法

    公开(公告)号:CN112532598B

    公开(公告)日:2021-10-26

    申请号:CN202011304350.9

    申请日:2020-11-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于实时入侵检测系统的过滤方法,包括:白名单与黑名单构建;风险损失评估;过滤器构建和部署:为白名单用户分配用于插入布隆过滤器的初始散列函数集;结合黑名单用户和其所对应的危害程度,自适应调整白名单用户的散列函数集,使得危害程度高的黑名单用户具有更高的被拦截概率;将调整过的散列函数集存入预设的散列表达器中;将白名单用户利用它的散列函数集插入到布隆过滤器中,结合散列表达器得到哈希自适应布隆过滤器,再将哈希自适应布隆过滤器部署到检测系统。本发明具备空间高效,快速检测的特点,能有效降低由黑名单用户带来的系统损失,并给出了有效的理论性能保障,可以应用于涉及实时入侵检测的应用。

    一种在分布式网络中检测持续型网络攻击的方法

    公开(公告)号:CN108494790B

    公开(公告)日:2020-01-21

    申请号:CN201810305902.4

    申请日:2018-04-08

    Applicant: 南京大学

    Abstract: 本发明公开了一种在分布式网络中检测持续型网络攻击的方法,首先提出分布式网络环境下检测持续型网络攻击系统模型,其次在数据预处理和传输阶段,提出利用编码技术来压缩每个分布式服务器记录的数据并优化存储空间,然后将压缩后的数据传输到指定的中央服务器;在数据恢复和检测阶段利用编码技术恢复上述的请求记录并检测攻击行为。同时,通过对上述检测方法给出了检测方法的理论性能保障。本发明首次提出在分布式网络中检测持续型网络攻击的方法,其有效地减少了在分布式环境下需要的数据传输量,并针对检测的准确度给出了有效的理论性能保障,可以用于分布式环境下检测持续型网络攻击,以保证网络安全。

    一种用于实时入侵检测系统的过滤方法

    公开(公告)号:CN112532598A

    公开(公告)日:2021-03-19

    申请号:CN202011304350.9

    申请日:2020-11-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于实时入侵检测系统的过滤方法,包括:白名单与黑名单构建;风险损失评估;过滤器构建和部署:为白名单用户分配用于插入布隆过滤器的初始散列函数集;结合黑名单用户和其所对应的危害程度,自适应调整白名单用户的散列函数集,使得危害程度高的黑名单用户具有更高的被拦截概率;将调整过的散列函数集存入预设的散列表达器中;将白名单用户利用它的散列函数集插入到布隆过滤器中,结合散列表达器得到哈希自适应布隆过滤器,再将哈希自适应布隆过滤器部署到检测系统。本发明具备空间高效,快速检测的特点,能有效降低由黑名单用户带来的系统损失,并给出了有效的理论性能保障,可以应用于涉及实时入侵检测的应用。

Patent Agency Ranking