增强机器学习流水线语料库以合成新机器学习流水线

    公开(公告)号:CN115796298A

    公开(公告)日:2023-03-14

    申请号:CN202211064368.5

    申请日:2022-09-01

    Abstract: 涉及增强机器学习流水线语料库以合成新机器学习流水线。根据实施方式的一方面,操作可以包括接收存储在ML语料数据库中的ML项目。操作还可以包括使与所接收的ML项目相关联的第一ML流水线集合中的第一ML流水线转变,以确定第二ML流水线集合。第一ML流水线的转变可以对应于用与预定义ML流水线集合中的一个预定义ML流水线相关联的第二ML模型替换与第一ML流水线相关联的第一ML模型。操作还可以包括基于与所确定的ML流水线集合中的每一个ML流水线相关联的性能分数,从第二ML流水线集合中选择一个或更多个ML流水线。操作还可以包括增强ML语料数据库以包括所选择的一个或更多个ML流水线和第一ML流水线集合。

    机器学习管道骨架实例化
    2.
    发明公开

    公开(公告)号:CN114970876A

    公开(公告)日:2022-08-30

    申请号:CN202210138550.4

    申请日:2022-02-15

    Abstract: 本公开涉及机器学习管道骨架实例化。操作包括获得机器学习ML管道骨架,其指示用来处理新ML项目的新数据集的一组第一功能块。操作还包括获得将数据集特征映射到相应功能块的关系映射,其指示现有ML项目的现有数据集的数据集特征与现有ML项目的现有ML管道的第二功能块的使用间的对应关系。操作还包括基于关系映射来将第一功能块映射到新数据集的相应部分。操作包括利用与一组第一功能块中的相应第一功能块各自对应的相应代码片段来实例化管道骨架,相应代码片段各自包括一个或更多个相应代码元素,其基于第一功能块的映射。

    机器学习项目的自动去噪
    3.
    发明公开

    公开(公告)号:CN115759278A

    公开(公告)日:2023-03-07

    申请号:CN202211064359.6

    申请日:2022-09-01

    Abstract: 提供了机器学习项目的自动去噪。根据实施方式的一方面,操作可以包括接收包括数据帧和ML流水线的ML项目,ML流水线包括与对应于ML项目的多个特征相关联的多个代码语句。操作还可以包括确定与ML流水线相对应的一个或更多个原子步骤,以确定原子化的ML流水线。操作还可以包括对原子化的ML流水线进行仪器化,以确定包括与ML项目相对应的一个或更多个操作的仪器化的ML流水线。操作还可以包括执行仪器化的ML流水线以基于一个或更多个操作中的每一个来捕获一个或更多个数据帧快照。操作还可以包括构建特征溯源图(FPG)。操作还可以包括基于所构建的FPG从与ML项目相对应的多个特征中识别一个或更多个被丢弃的特征。

    机器学习管道骨架实例化
    4.
    发明公开

    公开(公告)号:CN114970877A

    公开(公告)日:2022-08-30

    申请号:CN202210147656.0

    申请日:2022-02-17

    Abstract: 本发明涉及用于机器学习管道骨架实例化的方法、存储介质和系统。该方法的操作包括获得机器学习(ML)管道骨架,该机器学习(ML)管道骨架指示用来处理新ML项目的新数据集的一组第一功能块。另外地,对于所述一组第一功能块中的每个相应第一功能块,所述操作包括从现有ML管道获得现有代码片段,现有代码片段中的每个现有代码片段对现有ML管道的第二功能块进行实例化并且是相应第一功能块的潜在实例化。所述操作还包括:确定现有代码片段中的每个现有代码片段对于新数据集的相应适应性;以及基于所确定的适应性来选择用于实现相应第一功能块的特定现有代码片段。此外,所述操作包括基于特定现有代码片段来对管道骨架进行实例化。

Patent Agency Ranking