一种关系型数据库元组的数字指纹虚拟主键生成方法与系统

    公开(公告)号:CN118734357A

    公开(公告)日:2024-10-01

    申请号:CN202410819716.8

    申请日:2024-06-24

    Abstract: 本发明公开了一种适用于关系型数据库的数字指纹虚拟主键生成方法及系统,包括:关系型数据库元组的数值型属性提取;训练集和测试集分组;训练变分自编码器输出低维隐层向量;基于隐层向量构造中值树模型,并基于变分自编码器和中值树模型生成测试集元组的虚拟主键。本方法能适用于绝大多数关系型数据库元组,并能自定义指纹长度。本方法的生成效果稳定,能概率均匀地嵌入各指纹位,保证数字指纹方法的稳定性;能在较大程度上抵御元组属性删除攻击,恢复正确的虚拟主键。

    一种电网错误数据注入攻击路径预测方法、系统及设备

    公开(公告)号:CN117220971A

    公开(公告)日:2023-12-12

    申请号:CN202311237484.7

    申请日:2023-09-22

    Abstract: 本发明提供的一种电网错误数据注入攻击路径预测方法、系统及设备,包括以下步骤:步骤1,获取待测电力系统的运行数据,根据得到的运行数据获取得到待测电力系统运行的异常节点;步骤2,计算待测电力系统各个线路和每个异常节点之间的关联度;步骤3,根据得到的异常节点和关联度得到待测电力系统的高危线路集合;步骤4,对得到的高危线路集合进行分析,得到待测电力系统的电网错误数据注入攻击预测路径;本发明解决了系统存在可疑攻击时的攻击路径预测问题。

    一种基于预训练模型的政务文件归属省份分类方法

    公开(公告)号:CN114153803A

    公开(公告)日:2022-03-08

    申请号:CN202111470389.2

    申请日:2021-12-03

    Abstract: 本发明一种基于预训练模型的政务文件归属省份分类方法,步骤为:1)从csv和excel文件中提取特征字典;2)对特征字典中全部文本生成句向量;3)对句向量进行地区实体识别训练,得到地区命名实体识别模型;4)进行地区‑省份映射训练,得到地区‑省份映射模型。本发明所提出的基于预训练模型政务类csv、excel文件归属省份的分类方法能够有效地对政务类csv、excel文件进行中国省份文件分类,并有效的避免了同一文件内部的省份重叠问题,预测结果准确率高、误差小,计算复杂度低,有很高的实用价值。

    一种基于Bert和残差自注意力机制的政务文件主题分类方法

    公开(公告)号:CN114153802A

    公开(公告)日:2022-03-08

    申请号:CN202111469862.5

    申请日:2021-12-03

    Abstract: 本发明一种基于Bert和残差自注意力机制的政务文件主题分类方法,包括政务文件原始特征抽取和选择、政务文件原始特征清洗和优化、文本预训练以及基于残差自注意力机制的主题标签分类,本发明针对政务数据多源异构的特点,提出了统一的特征抽取、异常处理和特征选择方法,设计了具有针对性的特征清洗和优化策略,构建基于Bert预训练模型和残差自注意力机制的文件主题分类模型,解决了传统文件主题分类方法效率低和缺乏自适应能力的问题,实验基于公开政务文件数据集,在面向多达70种主题标签分类的实际应用场景中,分类准确率高达96.72%。

    一种基于二部图的股票协同交易疑点群体检测方法

    公开(公告)号:CN110362609B

    公开(公告)日:2021-09-07

    申请号:CN201910585215.7

    申请日:2019-07-01

    Abstract: 本发明公开了一种基于二部图的股票协同交易疑点群体检测方法,包括:根据股票交易历史数据,将交易事件和疑点账户作为二部图的两种不同节点,以循环迭代更新的方式搜索交易事件及筛选疑点账户,直至交易事件集合和疑点账户集合收敛;在收敛的交易事件集合和疑点账户集合的基础之上,构建账户间交易协同图,并基于账户间交易协同图进行社区划分,发现协同进行股票交易的账户社区,作为股票协同交易疑点群体。本发明通过挖掘与给定的疑点账户紧密同步交易股票的账户,以及频繁着重参与给定的股票交易事件的账户,揭露隐藏的账户之间异常交易协同行为,反映账户间通过协同交易影响甚至控制股价走势的潜在可能性,为股票二级市场风险预警提供参考。

    一种面向社交网络不规则短文本的粤语分词方法

    公开(公告)号:CN112307759A

    公开(公告)日:2021-02-02

    申请号:CN202011236593.3

    申请日:2020-11-09

    Abstract: 本发明涉及一种面向社交网络不规则短文本的粤语分词方法,属于自然语言处理领域。本发明的面向粤语语境的短文本清洗和分词的方法,具体包括四个功能模块,分别为支持用户自定义的短文本清洗模块、粤语联合语料库构建模块、短文本扫描和初步切分模块、未登录词处理及分词结果输出模块。本发明解决了现有技术中没有考虑到面向社交网络不规则短文本的粤语分词方法,提出了满足用户自身不同应用场景的个性化数据清洗模型,建立了面向社交网络的粤语联合语料库,设计了基于构建的联合语料库的分词模型,同时综合考虑了文本中出现未登录词的处理方案,提出对应的综合处理模型,最终在连登论坛平台爬取的短文本数据中验证,分词准确率达87%。

    一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统

    公开(公告)号:CN110781930A

    公开(公告)日:2020-02-11

    申请号:CN201910971176.4

    申请日:2019-10-14

    Abstract: 本发明公开了一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统,主要步骤为:1)从网络安全设备用户日志等数据中提取特征;2)对特征进行预处理和数据分析,获得特征之间以及特征与用户行为之间的关系;3)根据用户特征构建用户分组的聚类模型;4)根据聚类模型建立用户画像,并根据用户特征和用户画像的匹配结果决定用户是否存在行为异常;本发明实现简单、计算复杂度低,可以有效减少用户日志中行为分析的计算资源开销,不需要任何额外标记,仅需要网络安全设备自动记录的数据,具有实际应用的优势,提供了具有不同行为模式的用户分组方法和画像匹配方法,同时对用户行为是否存在异常进行了决策性判断。

    一种基于二部图的股票协同交易疑点群体检测方法

    公开(公告)号:CN110362609A

    公开(公告)日:2019-10-22

    申请号:CN201910585215.7

    申请日:2019-07-01

    Abstract: 本发明公开了一种基于二部图的股票协同交易疑点群体检测方法,包括:根据股票交易历史数据,将交易事件和疑点账户作为二部图的两种不同节点,以循环迭代更新的方式搜索交易事件及筛选疑点账户,直至交易事件集合和疑点账户集合收敛;在收敛的交易事件集合和疑点账户集合的基础之上,构建账户间交易协同图,并基于账户间交易协同图进行社区划分,发现协同进行股票交易的账户社区,作为股票协同交易疑点群体。本发明通过挖掘与给定的疑点账户紧密同步交易股票的账户,以及频繁着重参与给定的股票交易事件的账户,揭露隐藏的账户之间异常交易协同行为,反映账户间通过协同交易影响甚至控制股价走势的潜在可能性,为股票二级市场风险预警提供参考。

    数据流转发异常检测方法、控制器和系统

    公开(公告)号:CN107196891A

    公开(公告)日:2017-09-22

    申请号:CN201610147518.7

    申请日:2016-03-15

    Abstract: 本发明公开了一种数据流转发异常检测方法、设备和系统,涉及计算机网络通信领域,用于解决对由于流表异常导致数据流转发规则与数据流实际转发情况不一致进行检测的问题。数据流转发异常检测方法包括:控制器确定待检测的数据流所经过的交换设备;获取交换设备中与数据流匹配的至少一个流表项;流表项包含实际流量和匹配域;其中,实际流量为与匹配域对应计数器的值;根据交换设备上与匹配域相匹配的数据流的理论流量与实际流量建立超定方程组;其中,理论流量构成超定方程组的未知数向量,实际流量构成超定方程组的常数项向量;根据超定方程组确定至少一个流表项是否发生异常。本发明的实施例应用于SDN网络中。

    一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法

    公开(公告)号:CN105956184A

    公开(公告)日:2016-09-21

    申请号:CN201610383009.4

    申请日:2016-06-01

    CPC classification number: G06F17/30867 G06F17/3089

    Abstract: 本发明公开一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法,包括:1)通过话题传播网络中的拓扑特性来识别分布在多个话题中的垃圾信息发布团体;2)基于相邻时间间隔的话题转发网络之间的相似度对比,识别垃圾信息发布团体参与的异常话题;3)根据用户在多个话题中的累计权重进行聚类,把参与异常话题的所有用户分为正常用户和垃圾信息发布团体的异常用户;本发明所公开的一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法,基于话题传播中的转发网络的拓扑信息进行分析,不需要相关话题的文本内容及用户的其他信息,使得实现算法简单、计算复杂度低,能够有效识别微博中的垃圾信息发布团体。

Patent Agency Ranking