Patent search ap:("无锡江南计算技术研究所") AND inv:"吴伟" Page 3

21.

发明公开
一种面向量子加速设备的混合式编译方法有权

公开(公告)号：CN115271084A

公开(公告)日：2022-11-01

申请号：CN202210933691.5

申请日：2022-08-04

Applicant: 无锡江南计算技术研究所

Inventor： 朱琪 , 郑岩 , 吴伟 , 钱宏 , 尉红梅 , 何王全 , 王飞 , 陈德训

IPC: G06N10/80 , G06F8/41

Abstract: 一种面向量子加速设备的混合式编译方法，属于量子计算技术领域。本发明包括如下步骤：步骤S1，通过标准化的量子代码编程接口，对混合代码中的经典代码与量子代码进行识别；步骤S2，对经典代码进行编译，生成可执行码；步骤S3，运行经典代码的可执行码，若遇到量子代码编程接口，则进行步骤S4，并在接收到步骤S5的运行结果后，继续运行并重复本步骤的操作，直至整个计算进程结束；步骤S4，对量子代码进行编译，生成可执行码；步骤S5，运行量子代码的可执行码。本发明操作简单高效，易于实现，同时可靠性高。

22.

发明公开
片上存储空间动态配置方法审中-实审

公开(公告)号：CN114218148A

公开(公告)日：2022-03-22

申请号：CN202110398334.9

申请日：2021-04-14

Applicant: 无锡江南计算技术研究所

Inventor： 管茂林 , 钱宏 , 朱琪 , 吴伟 , 杨涛 , 王飞 , 樊行健

IPC: G06F15/167 , G06F15/177

Abstract: 本发明公开一种片上存储空间动态配置方法，包括以下步骤：S1、读取输入参数；S2、读取硬件的LDM配置寄存器；S3、获取计算核栈空间大小及计算核的栈指针；S4、对new_cache_size和old_cache_size进行比较；S5、将计算核栈空间转移至新分配的该局存空间中；S6、确认本计算核相关的DMA操作均已完成；S7、刷新计算核Cache；S8、对new_cache_size和old_cache_size进行比较；S9、释放mem_a空间，转到S11执行。本发明可以避免固定配置下因为LDM或者Cache容量不足造成的性能损失，最大程度发挥其性能优势。

23.

发明公开
动态内存管理方法审中-实审

公开(公告)号：CN114217938A

公开(公告)日：2022-03-22

申请号：CN202110349032.2

申请日：2021-03-31

Applicant: 无锡江南计算技术研究所

Inventor： 钱宏 , 王飞 , 吴伟 , 朱琪 , 管茂林 , 杨涛 , 尉红梅

IPC: G06F9/50

Abstract: 本发明公开一种动态内存管理方法，包括以下步骤：S1、在运行课题时指定x属性内存空间的总大小；S2、开辟相应大小的x属性内存空间；S3将目标码中的静态x属性内存空间映射到S2中所开辟的x属性内存空间的前半部分，剩余的后半部分x属性内存空间即为动态x属性内存空间；S4、用户课题在代码中调用xspace_malloc函数动态申请x属性内存空间；S6、用户课题可以在代码中调用get_allocatable_xspace_size获取当前剩余的动态x属性内存空间大小。本发明解决了在支持多空间属性的编程环境中，单纯使用malloc、free函数无法满足多空间属性的动态内存管理需求的问题。

24.

发明公开
一种编译自调优方法有权

公开(公告)号：CN114217805A

公开(公告)日：2022-03-22

申请号：CN202110330631.X

申请日：2021-03-26

Applicant: 无锡江南计算技术研究所

Inventor： 朱琪 , 王飞 , 吴伟 , 钱宏 , 管茂林 , 赵金伟

IPC: G06F8/41 , G06F9/445

Abstract: 本发明公开一种编译自调优方法，包括以下步骤：S1、对代码进行插桩；S2、收集代码运行时的信息数据；S3、根据访存密集程度和计算密集程度，将目标代码分为四类；S4、将S3中的分类信息传递给S11；S5、对系统环境参数进行配置；S6、对通用编译优化选项进行配置；S7、对定制编译优化选项进行配置；S8、对通用编译优化选项与定制编译优化选项进行分析分类；S9、对自调优过程的环境参数进行配置；S10、将S9中环境参数的配置信息传递给S11；S11、对使能概率进行调整；S12、进行编译选项的自动调优；S13、获得一组编译优化选项组合能。本发明能够充分发挥出处理器及系统软件环境某些定制化设计带来的性能红利，提高编译自调优过程效率。

25.

发明公开
自适应内建函数与指令操作选择翻译方法有权

公开(公告)号：CN112540750A

公开(公告)日：2021-03-23

申请号：CN201910897633.X

申请日：2019-09-23

Applicant: 无锡江南计算技术研究所

Inventor： 王飞 , 沈莉 , 周文浩 , 吴伟 , 钱宏 , 罗有才

IPC: G06F8/30 , G06F9/30

Abstract: 本发明公开一种自适应内建函数与指令操作选择翻译方法，基于编译器实现，包括以下步骤：S1、编译器使用最高优化等级编译该内建函数，当汇编指令少于或等于3条时，将SDNode一对一的降级为汇编指令；S2、当汇编指令大于3条时，判断该内建函数预设的使用频率，若使用频率不高，则以内建函数可拆分的伪指令节点和定义的虚拟寄存器为参数，通过BuildMI函数将内建函数降级为汇编指令；S3、若使用频率较高，则以内建函数的输入和输出作为源寄存器和目的寄存器，使用BuildMI函数创建一条伪指令，使用BuildMI函数扩展上述伪指令，并将扩展后的伪指令降级为汇编指令。本发明可以根据内建函数实现的复杂度选择内建函数节点降级的途径，以使程序的编译运行达到最优化的效果。

26.

发明公开
基于异构平台的自适应节点融合编译优化方法有权

公开(公告)号：CN112527304A

公开(公告)日：2021-03-19

申请号：CN201910885756.1

申请日：2019-09-19

Applicant: 无锡江南计算技术研究所

Inventor： 王飞 , 沈莉 , 吴伟 , 胡浩 , 钱宏

IPC: G06F8/41 , G06F16/901 , G06K9/62

Abstract: 本发明公开一种基于异构平台的自适应节点融合编译优化方法，包括以下步骤：S1、生成中间表示；S2、DAG融合子图识别；S3、节点融合策略；S4、代价评估；S5、自适应选择节点融合策略，即根据S4计算得到的第k个融合策略代价，结合目标后端的寄存器、cache、内存使用情况，自适应地选择最优的节点融合策略；S6、目标相关节点融合，根据节点融合策略，将S23中匹配得到的DAG子图的控制流和数据流关系，转移到S5选择出的节点融合策略所生成的融合后的DAG子图上，使用融合后的DAG子图替换融合前的DAG子图，转到S22；S7、生成目标代码，即编译器对降级完成后的DAG进行编译处理，生成异构平台代码。本发明为异构平台的节点融合优化提供精确指导，能够进一步挖掘异构平台复合指令的潜力，提升异构平台的性能。

27.

发明公开
面向多目标的细粒度编译自调优方法有权

公开(公告)号：CN112527300A

公开(公告)日：2021-03-19

申请号：CN201910879803.1

申请日：2019-09-18

Applicant: 无锡江南计算技术研究所

Inventor： 朱琪 , 吴伟 , 王飞 , 钱宏 , 周文浩 , 杨涛

IPC: G06F8/41

Abstract: 本发明公开一种面向多目标的细粒度编译自调优方法，包括以下步骤：S1、根据用户需求，确定编译优化的目标；S2、进行代码核心段标识，即对程序的执行时间进行拆分，并按照程序的执行时间长短对程序内的核心段函数进行排序，根据设定的阈值n，选取程序的执行时间最长的若干核心段函数；S3、对代码进行插桩，根据编译优化的目标，选择对应的插桩接口，用于量化评估编译优化效果；S4、修改配置文件，并启动自调优操作；S5、对调优结果的历史信息进行聚类分析，修改迭代过程的启发式策略。本发明能够挖掘编译优化选项的性能潜力，提高编译器的用户友好性，缩短用户进行应用调优的学习曲线。

28.

发明公开
基于编译实现的可扩展向量掩码功能的方法和装置有权

公开(公告)号：CN112445485A

公开(公告)日：2021-03-05

申请号：CN201910799256.6

申请日：2019-08-28

Applicant: 无锡江南计算技术研究所

Inventor： 沈莉 , 王飞 , 钱宏 , 管茂林 , 朱琪 , 吴伟 , 肖谦 , 武文浩

IPC: G06F8/41

Abstract: 本发明公开一种基于编译实现的可扩展向量掩码功能的方法和装置，包括以下步骤：S1、编译器输入用户程序，根据目标平台翻译出正确的掩码向量接口；S2、编译器前端模块对S1中获得的掩码向量接口进行关键字识别，选择对应平台的中端处理入口；S3、编译器中端模块根据目标平台的指令结构对掩码向量接口进行分析，选择合适的处理流程；S4、编译器后端模块将编译器中端模块生成的中间生成代码转换生成最终指令；S5、编译器根据向量宽度的增加，完成对平台向量宽度的识别，选择合适宽度的向量转换和掩码生成。本发明降低了重新开发代码的工作量和复杂度及用户移植的复杂度，更进一步的挖掘了课题的指令级并行性能。

29.

发明公开
一种基于采样剖析的轻量级程序代码重排方法有权

公开(公告)号：CN105279004A

公开(公告)日：2016-01-27

申请号：CN201510830299.8

申请日：2015-11-24

Applicant: 无锡江南计算技术研究所

Inventor： 钱宏 , 王飞 , 吴伟 , 李中升 , 尉红梅 , 漆锋滨

IPC: G06F9/445 , G06F12/0802

Abstract: 本发明提供了一种基于采样剖析的轻量级程序代码重排方法，包括：编译链接程序，其中预留一段代码空间；加载器读入目标程序；使得目标程序运行一遍，加载器收集目标程序运行时运行信息；利用收集到的运行信息指导代码重排；对代码执行垫塞优化；将垫塞优化后的代码写进新的目标程序。

30.

发明授权
合并执行大规模并行线程的数据扩展优化方法有权

公开(公告)号：CN102981839B

公开(公告)日：2015-08-12

申请号：CN201210441329.2

申请日：2012-11-06

Applicant: 无锡江南计算技术研究所

Inventor： 吴伟 , 卿鹏 , 文延华 , 王珊珊 , 何王全 , 刘勇 , 方燕飞 , 毛兴权

IPC: G06F9/44 , G06F9/46

Abstract: 本发明公开了一种合并执行大规模并行线程的数据扩展优化方法，包括：在合并执行的并行线程中识别线程不变量；所述线程不变量在每个合并执行的并行线程中保持一致；编译过程中，仅对非线程不变量，进行数据扩展。本发明减少了不必要的线程私有数据扩展，能有效缓解合并后栈空间的剧烈膨胀，提高程序的执行效率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification