一种基于熵增原理的规范化日志生成方法

    公开(公告)号:CN117709301A

    公开(公告)日:2024-03-15

    申请号:CN202311556155.9

    申请日:2023-11-17

    Abstract: 本发明公开了一种基于熵增原理的规范化日志生成方法,属于数据库日志审计技术领域,所述方法包括:基于熵增原理确定当前日志中各个字段的熵值;利用字段对应的熵值与设定阈值之间的大小关系判定其为重要字段或非重要字段;设定当前日志对应的关联主键,关联主键能够表征所述当前日志中所有所述重要字段与所有所述非重要字段之间唯一的映射关系;将当前日志转化为包括重要字段、关联主键和非重要字段的日志规范化结构。本方案采用熵增原理规范化方法能够有效处理多来源不同结构的原始日志,泛化能力强;此外,最终得到的包含重要字段与非重要字段及关联主键的日志规范化结构格式严密统一、规则定义简明,能够随着日志结构的变动快速迭代升级。

    一种代码的多维图张量融合表示与嵌入方法

    公开(公告)号:CN116720185A

    公开(公告)日:2023-09-08

    申请号:CN202310579722.6

    申请日:2023-05-23

    Abstract: 本发明公开了一种代码的多维图张量融合表示与嵌入的方法及应用,属于人工智能领域。包括:提取源代码文件与二进制文件的语法信息与层次结构信息;同时生成源代码文件与二进制文件的Abstract Syntax Tree抽象语法树(AST),Data Dependence Graph数据依赖图(DDG),Control Flow Graph控制流图(CFG),Natural Code Sequence自然语言序列(NCS)四种不同异构代码图结构;将四种异构代码图结构结合生成高维图张量;使用Graph Tensor Convolution Network可解释的图张量卷积神经网络(GTCN)来生成准确的代码语义嵌入并捕获代码内部特征,并将相关技术应用在各种下游任务中,如恶意代码识别,在检测效率与准确率方面取得了很好的平衡。

    一种代码作者性别确定方法、装置、设备和介质

    公开(公告)号:CN116821344A

    公开(公告)日:2023-09-29

    申请号:CN202310826029.4

    申请日:2023-07-07

    Abstract: 本发明公开了一种代码作者性别确定方法、装置、设备和介质,涉及计算机技术领域。先确定作为训练样本的代码以及对代码作者的标注性别,然后基于社会学和心理学中的性别差异,对代码的风格属性进行划分,确定训练样本对应各风格属性的性别统计信息,之后将各性别统计信息进行拼接并输入分类器中确定代码作者的预测性别,并以最小化预测性别与标注性别之间的偏差为优化目标对分类器进行训练,以通过训练后的分类器确定代码作者性别。本方案基于性别差异在代码写作中的表现,将代码中能够体现性别差异的风格属性对应的性别统计信息作为输入对分类器进行训练,使得训练后的分类器能够学习到代码中不同性别的风格属性特征,从而有效确定代码作者性别。

Patent Agency Ranking