算子的自动检测方法、装置、电子设备及介质

    公开(公告)号:CN115934346B

    公开(公告)日:2023-10-20

    申请号:CN202211689392.8

    申请日:2022-12-28

    Applicant: 北京大学

    Abstract: 本申请公开了一种算子的自动检测方法、装置、电子设备及介质。通过应用本申请的技术方案,可以实现一种能够对待检测算子在不同计算设备下的算子支撑能力的自动测试。通过待检测算子在计算精度、计算效率与标准结果的能力对比来获得算子在不同场景下的计算能力判断。从而达到避免相关技术中出现的,无法为不同硬件设备或不同应用功能应用所需算子的问题。

    硬件设备注册方法、装置、设备及存储介质

    公开(公告)号:CN116185371B

    公开(公告)日:2023-09-19

    申请号:CN202310448879.5

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本申请涉及一种硬件设备注册方法、装置、设备及存储介质,该方法通过确定待注册硬件设备匹配的设备类型,实现了将待注册硬件设备的目标功能注册到算法框架中。可见采用本申请的方案,无需编写支持该算法框架的接入代码并重新编译框架代码,提高了硬件设备接入算法框架的效率。

    深度学习框架的算子注册方法、装置、设备及存储介质

    公开(公告)号:CN116107669B

    公开(公告)日:2023-08-18

    申请号:CN202310400779.5

    申请日:2023-04-14

    Applicant: 北京大学

    Abstract: 本申请公开了一种深度学习框架的算子注册方法、装置、设备及存储介质,方法包括:获取待注册算子的信息,根据待注册算子的信息定义算子内核函数声明,算子内核函数声明中包括预设的形状输出函数;调用算子内核函数声明中预设的形状输出函数,得到输出的形状值,根据形状值定义算子内核函数,算子内核函数为一个compute函数;构造算子内核函数的多功能注册宏,根据多功能注册宏将待注册的算子内核函数注册到深度学习框架。本申请的算子注册方法,设计了算子内核函数注册接口,通过该接口,不同异构硬件的算子能够轻易的注册到深度学习框架中,同时减少了开发者在算子接入深度学习框架的代码开发量,减少开发者对深度学习框架自身结构的掌握程度。

    一种算子检测方法、装置以及计算机设备

    公开(公告)号:CN116629330B

    公开(公告)日:2024-04-16

    申请号:CN202310451059.1

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本公开提供了一种算子检测方法、装置以及计算机设备,其中,该方法包括:获取神经网络模型的模型文件;基于所述模型文件确定神经网络模型中各网络层的结构描述信息;对每个所述网络层的结构描述信息进行遍历,得到每个所述网络层的算子信息,并基于每个所述网络层的算子信息生成目标算子列表;所述算子信息用于指示各网络层中算子的属性信息和算子之间的依赖关系;对所述目标算子列表进行检查,得到检查结果;通过所述检查结果确定能够通过所述神经网络模型的硬件设备执行相应计算操作的算子。

    硬件设备注册方法、装置、设备及存储介质

    公开(公告)号:CN116185371A

    公开(公告)日:2023-05-30

    申请号:CN202310448879.5

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本申请涉及一种硬件设备注册方法、装置、设备及存储介质,该方法通过确定待注册硬件设备匹配的设备类型,实现了将待注册硬件设备的目标功能注册到算法框架中。可见采用本申请的方案,无需编写支持该算法框架的接入代码并重新编译框架代码,提高了硬件设备接入算法框架的效率。

    深度学习模型部署方法和装置
    7.
    发明公开

    公开(公告)号:CN116739040A

    公开(公告)日:2023-09-12

    申请号:CN202310561570.7

    申请日:2023-05-18

    Applicant: 北京大学

    Abstract: 本发明提供一种深度学习模型部署方法和装置,方法包括:获取深度学习原始模型文件、第一关系表及第二关系表;第一关系表中包含深度学习原始模型文件中中各原始算子、各原始算子的第一中间表示算子集版本;第二关系表中包括第一中间表示算子集版本,和所述第一中间表示算子集版本对应的第一推理引擎版本、第一中间表示版本之间的对应关系;基于深度学习原始模型文件、第一关系表以及第二关系表,确定进行深度学习原始模型转换需要的版本参数;基于版本参数,确定深度学习原始模型的可部署的中间表示模型;将可部署的中间表示模型部署在目标设备上。基于此,解决深度学习模型部署过程需要依赖大量的人工操作,不够便捷以及自动化的问题。

    一种集群中节点调度方法、装置、存储介质及终端

    公开(公告)号:CN116700950A

    公开(公告)日:2023-09-05

    申请号:CN202310519539.7

    申请日:2023-05-09

    Applicant: 北京大学

    Abstract: 本发明公开了一种集群中节点调度方法、装置、存储介质及终端,方法包括:在接收到待处理作业任务的调度指令时,在虚拟化集群中筛选出符合条件的多个候选节点;调用预先构建的作业统计反馈处理函数,并通过作业统计反馈处理函数获取每个候选节点的历史作业任务统计信息;历史作业任务统计信息是根据预先构建的作业统计函数对节点运行结束时的实际运行结果进行获取,并基于获取的实际运行结果更新该节点上的历史统计信息生成的;根据每个候选节点的历史作业任务统计信息,在多个候选节点中确定待处理作业任务的最优节点,并进行最优节点的调度。因此,采用本申请实施例,可以优化整个集群系统的调度管理,能提高资源节点的利用率。

    一种基于代码融合的编译优化方法、系统及电子设备

    公开(公告)号:CN116185426A

    公开(公告)日:2023-05-30

    申请号:CN202310402545.4

    申请日:2023-04-17

    Applicant: 北京大学

    Abstract: 本申请涉及一种基于代码融合的编译优化方法、系统及电子设备。所述方法包括:针对包含有主机代码和内核代码的异构源程序,分别用编译器对主机代码和内核代码进行编译,得到分别与主机代码和内核代码对应的第一中间表示和第二中间表示;基于第一中间表示依次创建主机代码的控制流图和数据流图,基于第二中间表示依次创建内核代码的控制流图和数据流图;将主机代码的控制流图和内核代码的控制流图融合,将主机代码的数据流图和内核代码的数据流图融合,得到异构源程序的全局细粒度依赖关系图;针对异构源程序的全局细粒度依赖关系图中的多个内核节点,将多个内核节点融合。本申请将多个内核节点融合,大幅提升了编译性能。

    一种模型测试方法、系统、介质及电子设备

    公开(公告)号:CN117076335A

    公开(公告)日:2023-11-17

    申请号:CN202311343167.3

    申请日:2023-10-17

    Applicant: 北京大学

    Abstract: 本申请公开了一种模型测试方法、系统、介质及电子设备,方法包括:获取待测试模型的模型名称以及数据信息;根据数据信息和预先建立的数据管理器,确定待测试模型所需的测试数据集;根据模型名称和预先建立的服务管理器,确定待测试模型对应的目标测试服务组件;根据测试数据集以及目标测试服务组件进行测试,生成待测试模型的测试结果,并反馈至客户端进行展示。由于本申请通过预先建立的数据管理器和服务管理器分别对不同模型的测试数据集和测试服务组件进行统一管理,因此实际应用中在确定模型的模型名称以及数据信息的情况下,可自动化执行模型测试流程,从而简化了模型测试复杂度,提高了模型测试的复用性和灵活性,提升了模型测试效率。

Patent Agency Ranking