深度学习框架的算子注册方法、装置、设备及存储介质

    公开(公告)号:CN116107669B

    公开(公告)日:2023-08-18

    申请号:CN202310400779.5

    申请日:2023-04-14

    Applicant: 北京大学

    Abstract: 本申请公开了一种深度学习框架的算子注册方法、装置、设备及存储介质,方法包括:获取待注册算子的信息,根据待注册算子的信息定义算子内核函数声明,算子内核函数声明中包括预设的形状输出函数;调用算子内核函数声明中预设的形状输出函数,得到输出的形状值,根据形状值定义算子内核函数,算子内核函数为一个compute函数;构造算子内核函数的多功能注册宏,根据多功能注册宏将待注册的算子内核函数注册到深度学习框架。本申请的算子注册方法,设计了算子内核函数注册接口,通过该接口,不同异构硬件的算子能够轻易的注册到深度学习框架中,同时减少了开发者在算子接入深度学习框架的代码开发量,减少开发者对深度学习框架自身结构的掌握程度。

    基于多面体模型建模的自动并行策略搜索方法及相关设备

    公开(公告)号:CN114925591A

    公开(公告)日:2022-08-19

    申请号:CN202111646797.9

    申请日:2021-12-29

    Abstract: 本发明公开了基于多面体模型建模的自动并行策略搜索方法及相关设备,所述方法包括:根据用户输入的模型对象得到深度学习算法的模型计算图;对模型计算图进行转换,得到转换后的模型计算图;将转换后的模型计算图进行均衡处理,得到均衡计算图;根据所述均衡计算图,创建多面体模型实例,并根据多面体模型实例输出并行策略;调用底层框架执行并行策略。本发明中通过将模型计算图进行转换及均衡处理,并在多面体模型的框架下创建多面体模型实例后,自动输出并行策略,实现了在多面体模型下将不同的算法逻辑进行建模,并自动输出并行策略过程,提升了并行策略搜索的效率,降低了深度学习算法的分布式训练开发和效率调优难度。

    基于驱动封装的GPU分时共享方法及系统

    公开(公告)号:CN112506666A

    公开(公告)日:2021-03-16

    申请号:CN202011525125.8

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。

    利用瑞士轮排序进行步态识别的行人再标识方法和装置

    公开(公告)号:CN104537356B

    公开(公告)日:2017-12-29

    申请号:CN201510014586.1

    申请日:2015-01-12

    Applicant: 北京大学

    Abstract: 本发明实施例提供了一种利用瑞士轮排序进行步态识别的行人再标识方法和装置。该方法包括:检测待检测视频中的行人的目标对象,提取所述目标对象的前景、步态周期和步态特征;将目标对象的步态特征和候选数据的步态特征进行相似性分析得到待排序数据;使用训练好的瑞士轮排序系统,将待排序数据进行多层次的分组排序,组合多层次的分组排序的结果得到待排序数据的最终排序结果,将目标对象识别为最终排序结果中排名最靠前的候选数据。本发明实施例能有效适应步态在多种情况下差异较大的问题,提高了监控视频场景中对象再标识的准确性,降低误检,实现了有效的行人检测和再标识任务。

Patent Agency Ranking