一种JAR包中嵌入和提取软件水印的方法、系统和存储介质

    公开(公告)号:CN116611032A

    公开(公告)日:2023-08-18

    申请号:CN202310555407.X

    申请日:2023-05-17

    Abstract: 本发明提出一种在JAR包中嵌入和提取软件水印的方法、系统和存储介质,软件水印嵌入的方法包括步骤:读取JAR包,获得多个class字节码文件;将待嵌入的软件水印加密为加密字符串;将加密字符串拆分为若干个数据段,构建包括数据段的数据帧,将数据帧嵌入至多个class字节码文件;整合嵌入后的多个class字节码文件,生成嵌入软件水印的JAR包。该方法摒弃常规方案中明文记录水印信息的方式,采用二进制方式,读取整个JAR包的中class字节码文件,按照一系列的加密、拆分和分布规则,将水印信息分别写入到对应的class字节码中,从而做到水印的嵌入。配合代码混淆处理,可以大幅度提升水印的隐蔽性,增加逆向工程难度,提高软件的安全性。

    一种自动聚类的调证数据快速识别方法和系统

    公开(公告)号:CN116401589A

    公开(公告)日:2023-07-07

    申请号:CN202310210510.0

    申请日:2023-03-07

    Abstract: 本发明提出了一种自动聚类的调证数据快速识别方法,该方法包括如下步骤:响应于建立XML语言的自定义标签的模板库;基于建立的所述模板库进行语料库的提取;将待导入文件基于提取的所述语料库进行文件TF‑IDF特征计算并提取特征,并将相同特征的文件分为一类,完成文件的自动分类;进一步进行文件模板的匹配,若匹配到模板则将匹配结果进行入库操作,否则结束。提出一种基于扩展标签模板库,同时依赖语料库完成待识别文件的特征值计算,从而完成文件集的自动分类,依托自动分类和特征值结果缓存技术,实现大量复杂文本文件的自动识别和导入的算法和完整系统解决方案,大大提升了模板识别速度和性能。

    一种基于大数据引擎的小数据量作业处理方法及装置

    公开(公告)号:CN115309560A

    公开(公告)日:2022-11-08

    申请号:CN202210999383.2

    申请日:2022-08-19

    Abstract: 本申请提出了一种基于大数据引擎的小数据量作业处理方法及装置,该方法包括以下步骤:S1、获取待处理数据文件,判断待处理数据文件是否是小数据量作业,如果是,则执行步骤S2;S2、判断资源池是否有空闲的运行时环境,如果有,则对业务代码进行统一封装,运行时环境对封装好的代码进行解释执行,如果没有,则执行步骤S3;S3、判断资源池是否达到资源容量上限,如果达到,则处理数据文件进入作业队列等待,如果没达到,则创建运行时环境放入资源池,再对业务代码进行统一封装,运行时环境对封装好的代码进行解释执行;S4、检测资源池中运行时环境的空闲时间是否超过预设阈值,如果超过,则进行运行时资源释放。

    一种基于数据挖掘的时空伴随关系分析方法和系统

    公开(公告)号:CN110933662B

    公开(公告)日:2022-07-15

    申请号:CN201911309596.2

    申请日:2019-12-18

    Abstract: 本申请公开了一种基于数据挖掘的时空伴随关系分析方法和系统。基于同一双卡移动设备的IMEI识别码规则获得各个双卡移动设备IMEI信号数据库;当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,进一步获得目标对象的伴随对象。该方案通过提取IMEI信号数据库和相邻基站组,利用目标基站和目标基站的伴随基站获取目标对象的伴随对象。

    一种集群布隆过滤器数据去重方法、终端设备及存储介质

    公开(公告)号:CN114443629A

    公开(公告)日:2022-05-06

    申请号:CN202111591763.4

    申请日:2021-12-23

    Inventor: 邢磊 张磊 姚志强

    Abstract: 本发明涉及一种集群布隆过滤器数据去重方法、终端设备及存储介质,该方法中包括:接收数据记录并写入消息队列;计算数据记录对应的排重键值;计算该消息记录对应的存储索引号i;将集群布隆过滤器中第i个过滤器槽中存储该消息记录对应的位向量,并初始化为0;通过k个散列函数分别对该消息记录对应的排重键值进行运算,根据k个运算结果将该消息记录对应的位向量中对应位置元素的值置1;对于待查找数据记录,根据其在集群布隆过滤器中对应过滤器槽中存储的位向量中对应元素的值是否为1来判断是否重复。本发明解决了实时数据去重负载过大难题。

    一种基于ketama算法的分库方法和系统

    公开(公告)号:CN116578641A

    公开(公告)日:2023-08-11

    申请号:CN202310298879.1

    申请日:2023-03-24

    Abstract: 公开了一种基于ketama算法的分库方法和系统,包括创建哈希环,利用ketama_hash对服务器信息进行哈希取值获得第一哈希值,并将第一哈希值映射至哈希环上;对数据中的key进行md5计算,再使用ketama_hash计算第二哈希值,并将第二哈希值映射至哈希环上;从哈希环上的第二哈希值处顺时针查找,将数据保存于找到的第一台服务器上。本申请解决了分库节点变化后引起的数据迁移量问题,并且加入复制因子参数,通过虚拟节点解决节点分布不均匀的问题。

    一种数据标准的智能推荐方法及装置

    公开(公告)号:CN114595379A

    公开(公告)日:2022-06-07

    申请号:CN202210049884.4

    申请日:2022-01-17

    Abstract: 本发明公开一种数据标准的智能推荐方法及装置,先通过对源表信息进行分词划分提取出与源表信息对应的关键词,通过关键词在数据库中匹配相关的数据标准名,得到相关的多组数据标准表;而后通过预设的评分规则对搜索出的多组数据标准表进行第一次筛选,挑选出预设数量的较相关数据标准表,再对挑选出的每一数据标准表的所有数据项采用相似度累积计算方法与源表信息内的所有数据项进行二次筛选,得到与源表信息最匹配的数据标准表,从而依次通过二次不同程度的筛选提升相似度比对效率以及准确率,同时也减轻了计算机比对运算次数,极大的减轻了接入人员工作负担,以及数据标准对标过程中出现的误对问题。

    一种数据脱敏方法、终端设备及存储介质

    公开(公告)号:CN114444115A

    公开(公告)日:2022-05-06

    申请号:CN202111550916.0

    申请日:2021-12-17

    Abstract: 本发明涉及一种数据脱敏方法、终端设备及存储介质,该方法中包括:基于待脱敏的姓名或身份证号中的具有固定数量种类的特征构建对应的特征集;从特征集中查找对应特征所在的位置,并将查找到的位置与固定偏移量的运算结果作为该特征对应的脱敏后的特征在特征集中的位置,进而获得脱敏后的特征;结合脱敏前或脱敏后的特征在特征集中的位置,计算其他特征对应的脱敏后的特征;将所有脱敏后的特征按顺序拼接为脱敏后的姓名或身份证号。本发明使得脱敏后的即保留了原有格式,又使其与真实数据混淆在一起也无法立即分辨出来。

    一种基于数据挖掘的时空伴随关系分析方法和系统

    公开(公告)号:CN110933662A

    公开(公告)日:2020-03-27

    申请号:CN201911309596.2

    申请日:2019-12-18

    Abstract: 本申请公开了一种基于数据挖掘的时空伴随关系分析方法和系统。基于同一双卡移动设备的IMEI识别码规则获得各个双卡移动设备IMEI信号数据库;当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,进一步获得目标对象的伴随对象。该方案通过提取IMEI信号数据库和相邻基站组,利用目标基站和目标基站的伴随基站获取目标对象的伴随对象。

    一种数据脱敏方法、终端设备及存储介质

    公开(公告)号:CN114444115B

    公开(公告)日:2025-04-08

    申请号:CN202111550916.0

    申请日:2021-12-17

    Abstract: 本发明涉及一种数据脱敏方法、终端设备及存储介质,该方法中包括:基于待脱敏的姓名或身份证号中的具有固定数量种类的特征构建对应的特征集;从特征集中查找对应特征所在的位置,并将查找到的位置与固定偏移量的运算结果作为该特征对应的脱敏后的特征在特征集中的位置,进而获得脱敏后的特征;结合脱敏前或脱敏后的特征在特征集中的位置,计算其他特征对应的脱敏后的特征;将所有脱敏后的特征按顺序拼接为脱敏后的姓名或身份证号。本发明使得脱敏后的即保留了原有格式,又使其与真实数据混淆在一起也无法立即分辨出来。

Patent Agency Ranking