一种基于机器学习的流程日志活动属性残缺规则提取方法

    公开(公告)号:CN113139712B

    公开(公告)日:2024-02-09

    申请号:CN202110257681.X

    申请日:2021-03-09

    Inventor: 聂富强 叶旺 孙曜

    Abstract: 本发明公开了一种基于机器学习的流程日志活动属性残缺规则提取方法。本发明包括如下步骤:步骤1、将日志数据进行预处理,首先将记录在业务流程信息管理系统中的流程日志数据提取出来,将XES格式的日志数据转换成适用于机器学习算法的CSV格式,并将流程日志数据以流程实例为单位划分为流程活动路径;步骤2、待流程日志数据进行预处理预处理后,对每条流程活动路径进行编码,将流程活动路径转换成流程特征向量;步骤3、使用机器学习中的分类回归决策树对流程特征向量进行分类,构建出一棵分类决策树。本发明能在很大程度上提高数据分析效率,为分析日志数据缺失原因提供参考。本发明提出的方法具有普适性好,准确率高,易于理解的特点。

    一种基于修饰模型集成的长时间序列预测方法

    公开(公告)号:CN113486303A

    公开(公告)日:2021-10-08

    申请号:CN202110826038.4

    申请日:2021-07-21

    Abstract: 本发明公开了一种基于修饰模型集成的长时间序列预测方法,通过划分重组数据集构建修饰模型,并在修饰模型中加入相关的修正函数,进一步将修正后的修饰模型与基线模型集成,从而得到时间序列预测结果。可以有效捕捉输出和输入之间精确的长程耦合相关性,可显著提高对长时间序列预测的准确性,增强模型泛化能力、数据迁移能力。解决了现有技术中多尺度的循环神经网络由于层次化结构建模导致的参数优化困难,与固定的尺度难以动态捕获长时间上的特征信息,导致在模型泛化能力、数据迁移能力等方面性能不理想的问题。

    基于生成式预训练模型参数精调整的可控文本生成方法

    公开(公告)号:CN114297382B

    公开(公告)日:2022-06-10

    申请号:CN202111627389.9

    申请日:2021-12-28

    Abstract: 本发明提出基于生成式预训练模型参数精调整的可控文本生成方法。首先在生成式预训练模型的词嵌入层自定义条件编码,再将控制文本作为提示进行参数精调整,更新控制文本参数,使整个原始输入序列的负对数似然函数值最小化,以减少计算量,从而提高模型训练速度;同时在模型生成操作层融入编码网络实现可控归一化,使特征方差在不同深度的解码模块中保持偏向控制文本的范围,以提高模型的可控生成能力,从而提高可控文本生成精度。

    基于生成式预训练模型参数精调整的可控文本生成方法

    公开(公告)号:CN114297382A

    公开(公告)日:2022-04-08

    申请号:CN202111627389.9

    申请日:2021-12-28

    Abstract: 本发明提出基于生成式预训练模型参数精调整的可控文本生成方法。首先在生成式预训练模型的词嵌入层自定义条件编码,再将控制文本作为提示进行参数精调整,更新控制文本参数,使整个原始输入序列的负对数似然函数值最小化,以减少计算量,从而提高模型训练速度;同时在模型生成操作层融入编码网络实现可控归一化,使特征方差在不同深度的解码模块中保持偏向控制文本的范围,以提高模型的可控生成能力,从而提高可控文本生成精度。

    一种基于机器学习的流程日志活动属性残缺规则提取方法

    公开(公告)号:CN113139712A

    公开(公告)日:2021-07-20

    申请号:CN202110257681.X

    申请日:2021-03-09

    Inventor: 聂富强 叶旺 孙曜

    Abstract: 本发明公开了一种基于机器学习的流程日志活动属性残缺规则提取方法。本发明包括如下步骤:步骤1、将日志数据进行预处理,首先将记录在业务流程信息管理系统中的流程日志数据提取出来,将XES格式的日志数据转换成适用于机器学习算法的CSV格式,并将流程日志数据以流程实例为单位划分为流程活动路径;步骤2、待流程日志数据进行预处理预处理后,对每条流程活动路径进行编码,将流程活动路径转换成流程特征向量;步骤3、使用机器学习中的分类回归决策树对流程特征向量进行分类,构建出一棵分类决策树。本发明能在很大程度上提高数据分析效率,为分析日志数据缺失原因提供参考。本发明提出的方法具有普适性好,准确率高,易于理解的特点。

Patent Agency Ranking