基于数据分类分级的解释分析方法、装置、设备及介质

    公开(公告)号:CN116204823A

    公开(公告)日:2023-06-02

    申请号:CN202211606947.8

    申请日:2022-12-13

    Abstract: 本申请公开了一种基于数据分类分级的解释分析方法、装置、设备及存储介质,涉及数据处理技术领域,包括:获取待分类分级数据并对所述待分类分级数据进行数据分类分级处理以得到相应的数据分类分级结果;基于所述待分类分级数据和所述数据分类分级结果利用第一预设算法进行模型训练得到相应的训练后模型,并将所述训练后模型进行拆解以得到与所述数据分类分级结果相应的数据分类分级依据;利用正则表达式将所述数据分类分级依据转化为相应的数据分类分级规则。本申请基于第一预设算法得到相应的数据分类分级依据,并基于正则表达式得到可积累且可复用的数据分类分级规则,进而提高结果的可解释性,减少人工分析的人力和时间成本。

    一种伪列数据的生成方法、装置、设备和介质

    公开(公告)号:CN115758243A

    公开(公告)日:2023-03-07

    申请号:CN202211435212.3

    申请日:2022-11-16

    Inventor: 秦坤 莫凡

    Abstract: 本申请公开了一种伪列数据的生成方法、装置、设备和介质,基于机器学习的分类任务,确定分类标签;分类标签可以看作是分类任务所对应的分类结果。为了降低伪列数据对机器学习造成的影响,可以选取与分类标签相关性较弱或者不具有相关性的数据类型。并且为了避免伪列数据被直接发现,还需要保证伪列数据的类型与原始数据中包含的各列数据的类型之间具有一定的相关性。因此可以按照设定的伪列数据列数,选取与分类标签满足非相关性要求,并且与原始数据中各类数据满足相关性要求的伪列类型。依据伪列类型对应的数据生成规则,可以构造伪列数据。在构造伪列数据时充分考虑了与机器学习相关的分类标签,降低了伪列数据对机器学习分类的影响。

    一种网络中异常点的检测方法、检测系统及相关装置

    公开(公告)号:CN111092891A

    公开(公告)日:2020-05-01

    申请号:CN201911328416.5

    申请日:2019-12-20

    Abstract: 本申请提供一种网络中异常点的检测方法,包括:获取网络安全历史数据的时序统计量;利用预设周期性度量从时序统计量中筛选得到具有周期性的时间序列;判断时间序列是否存在缺省值;若是,则对时间序列进行插值填充,并在插值填充后提取周期性基准值;根据周期性基准值得到待检测点的预测值;根据预测值确定异常点。本申请实现了对于时序统计量的周期性筛选,并利用插值填充进行数据预处理,考虑了时序随机扰动对于异常点判定过程中的干扰,对于异常点的定位准确,提高了检测效率,时间复杂度低,适合大规模增量学习。本申请还提供一种网络中异常点的检测系统、计算机可读存储介质和一种终端,具有上述有益效果。

    新出现实体的检测方法、装置、电子装置和存储介质

    公开(公告)号:CN111881686B

    公开(公告)日:2024-11-05

    申请号:CN202010697611.1

    申请日:2020-07-20

    Abstract: 本申请涉及一种新出现实体的检测方法、装置、电子装置和存储介质,其中,该新出现实体的检测方法包括:获取从审计日志中提取到的目标字段信息;以第一时间段为统计周期,周期性的根据目标字段信息获取第一时间段内的多个实体并统计每一实体对应的统计特征;以第二时间段为检测周期,周期性的根据目标字段信息检测每一实体出现的时刻;第二时间段大于第一时间段;根据每一实体出现的时刻以及对应实体的统计特征,计算每一实体的新颖程度并排序。通过本申请,解决了无法确定多个实体的出现顺序的问题。

    基于关键词的文本分类方法、装置和计算机设备

    公开(公告)号:CN116304008A

    公开(公告)日:2023-06-23

    申请号:CN202211446365.8

    申请日:2022-11-18

    Inventor: 秦坤 莫凡

    Abstract: 本申请涉及一种基于关键词的文本分类方法、装置和计算机设备,其中,该基于关键词的文本分类方法包括:创建每个类别名称的中心词,并确定中心词对应的第一目标关键词集合,对待分类文本进行关键词提取,得到待分类文本的第二目标关键词集合,从而在第一目标关键词集合和第二目标关键词集合相匹配时,基于第一目标关键词集合对应的类别名称,确定待分类文本的类别,解决了无法灵活调整文本分类过程中的相关参数的问题,实现了灵活调整文本分类过程中的相关参数,以提高文本分类的效率。

    一种字符串脱敏方法、装置、设备及存储介质

    公开(公告)号:CN113626849A

    公开(公告)日:2021-11-09

    申请号:CN202110987968.8

    申请日:2021-08-26

    Inventor: 秦坤 范渊 刘博

    Abstract: 本发明公开了一种字符串脱敏方法、装置、设备及存储介质,该方法包括:确定字符串中需要脱敏的任意字符为待脱敏字符,将待脱敏字符转换为相应的数值,并确定转换为的数值所属数值范围对应的数据类型为待脱敏字符的数据类型;利用与待脱敏字符的数据类型对应的映射函数对待脱敏字符转换为的数值进行映射,得到相应的数值;其中,不同数据类型对应的数值范围不同,对待脱敏字符进行映射得到的数值属于待脱敏字符的数据类型对应的数值范围;将映射得到的数值转换为相应的字符,并确定转换为的字符为对待脱敏字符进行脱敏后所得字符。可见,本申请能够在字符脱敏中保留字符数据类型,且简单方便同时高效,能够有效降低维护成本及计算成本。

    一种检测对Web站点的团伙攻击的方法、装置及介质

    公开(公告)号:CN110995714A

    公开(公告)日:2020-04-10

    申请号:CN201911240585.3

    申请日:2019-12-06

    Abstract: 本申请公开了一种检测对Web站点团伙攻击的方法、装置及介质,方法包括:获取Web站点的Web审计日志,根据Web审计日志以及预设时间窗口获取时序特征;利用时序特征中的历史时序特征训练出攻击检测模型,并利用当前时序特征更新攻击检测模型;若当前时序特征在攻击检测模型中的得分超过预设阈值,将当前时序特征判定为异常时序特征,确定出团伙攻击时间。因此,本方法能够同时关注多种具有团伙攻击特性的攻击类型,通过对多维时间序列进行实时检测,能够根据当前时序特征及时准确地确定出异常时序特征,及时确定出对Web站点的团伙攻击的团伙攻击时间。

Patent Agency Ranking