-
公开(公告)号:CN114217913B
公开(公告)日:2025-05-20
申请号:CN202110325187.2
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F9/48
Abstract: 本发明公开一种异构众核架构下的任务动态分配异步管理方法,包括以下步骤:S1、运算核心向控制核心发送任务请求;S2、初始化任务池;S3、判断任务请求类型是计算任务还是控制代理任务;S4、控制核心响应运算核心请求,分配任务至运算核心;S5、控制核心继续本地任务,运算核心接收来自控制核心的任务序号,执行对应任务;S6、向控制核心发送任务完成报告信号;S7、更新任务池;S8、运算核心查询是否更新任务;S9、控制核心继续执行本地任务;S10、等待所有任务执行完毕或得到最终结果,通知计算核心退出。本发明解决了控制核心需要通过轮询等方式主动查看任务完成状态,而不能进行其他操作的问题。
-
公开(公告)号:CN114217804B
公开(公告)日:2025-05-16
申请号:CN202110324723.7
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种支持多格式半精度浮点的编译方法,包括以下步骤:S1、用户代码使用编译器提供的float16关键字来申明半精度浮点数据类型;S2、用户代码根据需要调用半精度浮点数据格式切换接口进行格式切换;S3、用户代码在切换半精度浮点数据格式后,调用编译器提供的半精度浮点数据转换接口进行数据格式转换;S4、在完成半精度浮点数据格式切换与数据转换后,用户程序在当前半精度浮点格式下进行后续的计算,需要再次切换半精度浮点格式时重复S2、S3。本发明可以在不增加代码编写复杂度的前提下发挥FP16和BF16两种半精度浮点格式的优势,满足应用场景使用半精度浮点加速计算的需求。
-
公开(公告)号:CN119884771A
公开(公告)日:2025-04-25
申请号:CN202411886302.3
申请日:2024-12-20
Applicant: 无锡江南计算技术研究所
Abstract: 本申请涉及一种重大事件趋势预测方法、装置、设备、存储介质和程序产品。该方法先确定待趋势预测事件对应的初始事件集合,在初始事件集合中基于事件标识进行事件抽取,根据抽取出的事件得到目标事件集合。接着确定预测指标和预测结论,将目标事件集合中的每个事件分别与预测指标进行文本匹配,得到每个事件的匹配结果。再根据各匹配结果确定不同预测结论的发生概率,以根据该概率得到待趋势预测事件的趋势预测结果。本申请的重大事件趋势预测方法在提高对重大事件趋势预测准确性的同时,还提高了对重大事件的预测效率,节省了预测成本。
-
公开(公告)号:CN119807999A
公开(公告)日:2025-04-11
申请号:CN202411881138.7
申请日:2024-12-19
Applicant: 无锡江南计算技术研究所
IPC: G06F18/25 , G06F18/213 , G06N3/045
Abstract: 本发明公开了一种基于神经网络的高精度信号智能检测识别方法和装置,涉及计算机技术领域。该方法包括:加载训练完成的信号检测网络,信号检测网络用于在信号时频图像中对信号进行定位和识别;其中,信号检测网络包括轻量化的主干网络、特征融合网络和预测网络,轻量化的主干网络包括四尺度的下采样检测头,轻量化的主干网络包括并集注意力机制模块,并集注意力机制包括通道注意力子模块与空间注意力子模块;获取待检测信号,并对待检测信号进行时频变换,得到待检测信号时频图像;基于信号检测网络对待检测信号时频图像进行定位和识别,得到待检测信号的信号检测数据。本发明可以在保证效率的同时兼顾信号检测的准确率。
-
公开(公告)号:CN114218065B
公开(公告)日:2025-04-08
申请号:CN202110453215.9
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F11/3604
Abstract: 本发明公开一种指令流一致性测试方法,S1、初始化各项参数;S2、读入命令行参数;S3、设置共享空间的大小,申请共享的可执行空间;S4、Fork进程,并将进程绑定在不同核心上;S5、进入指令Cache测试入口模块,初始化由随机数组成的数组,并添加前缀指令;S6、进入自动测试模块;S7、进入执行指令模块;S8、执行指令模块运行结束,并进入结束测试模块;S9、在结束测试模块中,判断是否超过设定的执行遍数,如果超过,则进行结果校验,如果没超过,则再次进入自动测试模块;S10、结束测试后,汇报测试结果并回收进程,然后退出并结束。本发明解决了指令Cache一致性验证困难的问题。
-
公开(公告)号:CN115271084B
公开(公告)日:2024-08-30
申请号:CN202210933691.5
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
Abstract: 一种面向量子加速设备的混合式编译方法,属于量子计算技术领域。本发明包括如下步骤:步骤S1,通过标准化的量子代码编程接口,对混合代码中的经典代码与量子代码进行识别;步骤S2,对经典代码进行编译,生成可执行码;步骤S3,运行经典代码的可执行码,若遇到量子代码编程接口,则进行步骤S4,并在接收到步骤S5的运行结果后,继续运行并重复本步骤的操作,直至整个计算进程结束;步骤S4,对量子代码进行编译,生成可执行码;步骤S5,运行量子代码的可执行码。本发明操作简单高效,易于实现,同时可靠性高。
-
公开(公告)号:CN117992715A
公开(公告)日:2024-05-07
申请号:CN202410173432.6
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。
-
公开(公告)号:CN114217807B
公开(公告)日:2024-04-30
申请号:CN202110381660.9
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构众核架构的直接内存访问编译优化方法,包括以下步骤:S1、通过调度原语cache_read,将张量数据由主存搬移到局存;S2、通过调度原语pragma,将S11中的数据搬移操作改写为DMA GET操作;S3、通过调度原语double_buffer,将S2中的DMA GET操作优化为双缓冲模式;S4、通过调度原语pragma,在局存副本AA使用位置前插入回答字判断操作;S5、通过调度原语cache_write,将结果张量B的局存副本BB由局存搬移至主存。本发明充分利用硬件资源,最大程度实现算子的计算访存操作的重叠,从而提升深度学习负载在异构众核平台上的性能。
-
公开(公告)号:CN113900816B
公开(公告)日:2024-03-22
申请号:CN202111201772.8
申请日:2021-10-15
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明实施例提供一种多深度缓冲激活重发方法及装置,所述方法包括:高速缓冲存储器接收到访存请求,获取访存请求的请求地址,根据请求地址判断访存请求是否命中;未命中则发送访存请求进入脱靶缓冲,并设置第一重发标识位;高速缓冲存储器接收到后续未命中请求时,获取后续未命中请求后续地址,与请求地址进行地址相关性判断;当不相关时,发送后续未命中请求进入脱靶缓冲,设置第二重发标识位;检测到脱靶缓冲中的访存请求和后续未命中请求完成从主存装载后,通过激活重发步骤,对脱靶缓冲中的访存请求进行重发。采用本方法能够支持访存请求的乱序发射和乱序完成,同时保证脱靶请求重发后的正确性,从而提高数据Cache的性能和效率。
-
公开(公告)号:CN117348712A
公开(公告)日:2024-01-05
申请号:CN202311317820.9
申请日:2023-10-11
Applicant: 无锡江南计算技术研究所
IPC: G06F1/3206 , G06F1/3234 , G06F1/3296 , G06F1/324
Abstract: 本发明实施例公开了一种系统功耗控制方法、装置、设备及介质,该方法包括:获取超级计算机的当前功耗数据、温度关联数据和节点功耗关联数据;根据温度关联数据和节点功耗关联数据,确定系统功耗阈值;根据当前功耗数据和系统功耗阈值,确定超级计算机的功耗调整策略;根据功耗调整策略,调整超级计算机的系统功耗。上述方案,通过根据温度关联数据和节点功耗关联数据,确定系统功耗阈值,提高了确定的系统功耗阈值的准确度,进而提高了确定的功耗调整策略的准确度,提高了后续根据功耗调整策略对系统功耗进行控制的准确度。
-
-
-
-
-
-
-
-
-