-
公开(公告)号:CN112558978B
公开(公告)日:2022-11-25
申请号:CN201910918623.X
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种支撑异构众核全芯片视角的加速编程和编译方法,包括以下步骤:S1、识别__cross关键字声明的全局变量;S2、初始化操作;S3、全芯片加速模式的选择;S4、启动N个运算核组;S5、进入等待所有线程结束的状态;S6、进入等待S4中线程函数的状态信息的状态;S7、置线程结束的标志;S8、线程回收操作;S9、创建pthread线程;S10、线程绑定操作;S11、每个pthread线程将运算核组编号对应的运算核组启动;S12、进入等待线程结束的状态;S13、启动线程函数执行;S14、置线程结束的标志;S15、进行线程回收操作,更新加速核心的状态信息;S16、控制核心运行结束。本发明支持全芯片视角多模式的并行加速,以应对异构众核处理器的芯片特点和应用需求,为用户提供全片内存视角和全片资源管理方案。
-
公开(公告)号:CN112558978A
公开(公告)日:2021-03-26
申请号:CN201910918623.X
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种支撑异构众核全芯片视角的加速编程和编译方法,包括以下步骤:S1、识别__cross关键字声明的全局变量;S2、初始化操作;S3、全芯片加速模式的选择;S4、启动N个运算核组;S5、进入等待所有线程结束的状态;S6、进入等待S4中线程函数的状态信息的状态;S7、置线程结束的标志;S8、线程回收操作;S9、创建pthread线程;S10、线程绑定操作;S11、每个pthread线程将运算核组编号对应的运算核组启动;S12、进入等待线程结束的状态;S13、启动线程函数执行;S14、置线程结束的标志;S15、进行线程回收操作,更新加速核心的状态信息;S16、控制核心运行结束。本发明支持全芯片视角多模式的并行加速,以应对异构众核处理器的芯片特点和应用需求,为用户提供全片内存视角和全片资源管理方案。
-
公开(公告)号:CN114217937A
公开(公告)日:2022-03-22
申请号:CN202110348948.6
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种缓解假共享问题的编译器支持方法,包括以下步骤:S1、用户在程序中,对多线程Cache之间可能存在假共享的变量声明分别使用__attribute__((cacheline))接口;S2、编译器将声明树节点的基类tree_decl_common结构体中的标志位cacheline置为1,将align设置为Cache Line大小,并将tree_decl_common的基类tree_base结构体中的user_align置为1。本发明解决了某些Cache结构不保证横向一致性带来的假共享问题。
-
公开(公告)号:CN114218148A
公开(公告)日:2022-03-22
申请号:CN202110398334.9
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F15/167 , G06F15/177
Abstract: 本发明公开一种片上存储空间动态配置方法,包括以下步骤:S1、读取输入参数;S2、读取硬件的LDM配置寄存器;S3、获取计算核栈空间大小及计算核的栈指针;S4、对new_cache_size和old_cache_size进行比较;S5、将计算核栈空间转移至新分配的该局存空间中;S6、确认本计算核相关的DMA操作均已完成;S7、刷新计算核Cache;S8、对new_cache_size和old_cache_size进行比较;S9、释放mem_a空间,转到S11执行。本发明可以避免固定配置下因为LDM或者Cache容量不足造成的性能损失,最大程度发挥其性能优势。
-
-
-