-
公开(公告)号:CN114972955B
公开(公告)日:2024-08-20
申请号:CN202210646271.9
申请日:2022-06-08
Applicant: 清华大学
IPC: G06F7/00 , G06V10/82 , G06V10/74 , G06V10/776
Abstract: 本公开涉及一种数据处理方法、装置及存储介质,其中,该方法可以包括获取深度学习模型中的待处理数据组;确定与待处理数据组中各待处理数据相匹配的模拟方式,模拟方式用于基于不同于待处理数据的数据类型的其他数据类型,表示待处理数据的数据类型;根据各待处理数据相匹配的模拟方式对各待处理数据进行处理,生成各待处理数据对应的模拟数据,模拟数据通过所述其他数据类型表示;对各待处理数据对应的模拟数据进行处理,得到数据处理结果。通过本公开,在保证数据处理精度的情况下,进行数据加速处理,提供了高效计算能力,有效提升了加速器的性能;同时,扩展了加速器的使用场景,有效降低了对加速器的硬件要求。
-
公开(公告)号:CN115470377B
公开(公告)日:2024-07-16
申请号:CN202110655697.6
申请日:2021-06-11
Applicant: 清华大学
IPC: G06F16/901 , G06F16/2455 , G06F16/23
Abstract: 一种流式图数据处理方法、系统。该流式图数据处理方法包括:接收多个会话对待处理的图的更新,每个会话包括至少一个更新;根据预定分析算法判断更新对图的分析结果是否存在影响;根据更新对图的分析结果是否存在影响对更新进行分类,其中,将存在影响的更新分类为有关更新,将不存在影响的更新分类为无关更新,但同一会话中位于有关更新之后的所有更新分类为下轮处理更新用于在下一轮处理中重新分类;并行处理无关更新;在无关更新处理结束后或被中断后,串行处理有关更新。该流式图数据处理方法有效地提高了吞吐量。
-
公开(公告)号:CN115470377A
公开(公告)日:2022-12-13
申请号:CN202110655697.6
申请日:2021-06-11
Applicant: 清华大学
IPC: G06F16/901 , G06F16/2455 , G06F16/23
Abstract: 一种流式图数据处理方法、系统。该流式图数据处理方法包括:接收多个会话对待处理的图的更新,每个会话包括至少一个更新;根据预定分析算法判断更新对图的分析结果是否存在影响;根据更新对图的分析结果是否存在影响对更新进行分类,其中,将存在影响的更新分类为有关更新,将不存在影响的更新分类为无关更新,但同一会话中位于有关更新之后的所有更新分类为下轮处理更新用于在下一轮处理中重新分类;并行处理无关更新;在无关更新处理结束后或被中断后,串行处理有关更新。该流式图数据处理方法有效地提高了吞吐量。
-
公开(公告)号:CN114327479B
公开(公告)日:2025-03-18
申请号:CN202111618375.0
申请日:2021-12-27
Applicant: 清华大学
Abstract: 一种用于大数据的数据处理方法和数据处理装置。该数据处理方法包括:获取用原生编程语言编写的主程序;在原生系统中将主程序进行编译并生成可加载模块,其中,可加载模块包括第一部分程序和第二部分程序;由原生系统中运行的虚拟机加载可加载模块,并且将第二部分程序转换为预定虚拟机大数据处理体系支持的虚拟机代码;以及由虚拟机运行可加载模块包含的主程序,其中,虚拟机构建可加载模块对应的有向无环图程序,然后运行有向无环图程序,将第一部分程序交由原生系统运行,将转换后的第二部分程序交由预定虚拟机大数据处理体系运行。该数据处理方法可以在融入现有虚拟机大数据软件生态的前提下构建高性能大数据处理框架。
-
公开(公告)号:CN114972955A
公开(公告)日:2022-08-30
申请号:CN202210646271.9
申请日:2022-06-08
Applicant: 清华大学
IPC: G06V10/82 , G06V10/74 , G06V10/776
Abstract: 本公开涉及一种数据处理方法、装置及存储介质,其中,该方法可以包括获取深度学习模型中的待处理数据组;确定与待处理数据组中各待处理数据相匹配的模拟方式,模拟方式用于基于不同于待处理数据的数据类型的其他数据类型,表示待处理数据的数据类型;根据各待处理数据相匹配的模拟方式对各待处理数据进行处理,生成各待处理数据对应的模拟数据,模拟数据通过所述其他数据类型表示;对各待处理数据对应的模拟数据进行处理,得到数据处理结果。通过本公开,在保证数据处理精度的情况下,进行数据加速处理,提供了高效计算能力,有效提升了加速器的性能;同时,扩展了加速器的使用场景,有效降低了对加速器的硬件要求。
-
公开(公告)号:CN115470376A
公开(公告)日:2022-12-13
申请号:CN202110653899.7
申请日:2021-06-11
Applicant: 清华大学
IPC: G06F16/901 , G06F16/903 , G06F16/23
Abstract: 一种数据处理方法、系统。该数据处理方法包括:获取待处理的图的数据;以及以嵌套动态数组的方式存储图的数据,其中,嵌套动态数组的每个条目包括对应于所述图的一个顶点的边信息动态数组,边信息动态数组的每个条目存储对应于一个顶点的一条出边的边信息,嵌套动态数组的至少一个条目包括索引查找表,索引查找表关联地存储至少一个条目对应的顶点的每个出边的标识与表示对应出边的边信息在存储对应出边的边信息动态数组中的存储位置的索引,并且索引查找表中存储每个出边的标识的位置与对应出边的标识之间存在对应关系。该数据处理方法维护边的索引以避免冗余扫描,从而实现相比最新的技术几个数量级的性能提升。
-
公开(公告)号:CN114327479A
公开(公告)日:2022-04-12
申请号:CN202111618375.0
申请日:2021-12-27
Applicant: 清华大学
Abstract: 一种用于大数据的数据处理方法和数据处理装置。该数据处理方法包括:获取用原生编程语言编写的主程序;在原生系统中将主程序进行编译并生成可加载模块,其中,可加载模块包括第一部分程序和第二部分程序;由原生系统中运行的虚拟机加载可加载模块,并且将第二部分程序转换为预定虚拟机大数据处理体系支持的虚拟机代码;以及由虚拟机运行可加载模块包含的主程序,其中,虚拟机构建可加载模块对应的有向无环图程序,然后运行有向无环图程序,将第一部分程序交由原生系统运行,将转换后的第二部分程序交由预定虚拟机大数据处理体系运行。该数据处理方法可以在融入现有虚拟机大数据软件生态的前提下构建高性能大数据处理框架。
-
-
-
-
-
-