-
-
公开(公告)号:CN115146784A
公开(公告)日:2022-10-04
申请号:CN202210348141.7
申请日:2022-03-30
Applicant: 国际商业机器公司
Abstract: 提供了一种方法、系统和程序产品,其在训练机器学习模型时分析第一数据准备流水线中的第一数据变换运算符的集合,第一数据准备流水线根据训练数据集生成多个构造特征。该方法、系统和程序产品从第一数据准备流水线创建多个第二数据准备流水线,其中,第一数据变换运算符的集合被转换为第二数据变换运算符的集合,并且每个数据变换运算符被分配给多个第二数据准备流水线之一。该方法、系统和程序产品将多个第二数据准备流水线部署到运行时系统。
-
公开(公告)号:CN104252472A
公开(公告)日:2014-12-31
申请号:CN201310261903.0
申请日:2013-06-27
Applicant: 国际商业机器公司
CPC classification number: G06F9/4881 , G06F17/30345 , G06F17/30424 , G06F17/30486 , G06F17/30445 , G06F17/30563
Abstract: 本发明公开了一种用于并行化数据处理的方法和装置。所公开的方法包括:解析数据处理流,以便切割用于所述数据处理流的写表序列;至少部分地基于被切割的所述写表序列来生成所述数据处理流的至少两个实例;以及调度所述至少两个实例进行并行化的数据处理。
-
-