-
公开(公告)号:CN110929850A
公开(公告)日:2020-03-27
申请号:CN201911177238.0
申请日:2019-11-26
Applicant: 国家超级计算无锡中心
Abstract: 本发明提供的基于申威处理器的深度学习算子自动优化系统,包括获取单元,获取专用的描述语言定义计算任务和优化空间的描述;调度单元,根据优化空间的描述构建优化空间,依据优化空间中不同优化方法对计算任务描述调度生成若干不同的计算实现,输出用中间表示表达的计算实现;优化单元,接收中间表示,对中间表示执行优化,输出优化后的中间表示;优化空间搜索单元,从优化后的中间表示中搜索出最优的计算实现;代码生成单元,将最优的计算实现翻译为在申威处理器上可以执行的代码。本发明能够解决现有技术中优化性能低、难以移植、优化时间开销大的问题,高效于手动优化技术和自动优化技术,并且可以能够方便地移植到其他机构上使用。