-
公开(公告)号:CN117407299B
公开(公告)日:2024-05-07
申请号:CN202311350449.6
申请日:2023-10-18
Applicant: 北京大学
IPC: G06F11/36
Abstract: 本申请涉及人工智能技术领域,具体提供一种模型测试方法,旨在解决面对不同测试需求时会有大量繁杂重复的工作,测试效率低下的问题。为此目的,本申请的模型测试方法应用于服务端,包括:接收客户端发送的待测模型文件、测试数据信息、待测模型的硬件设备参数和测试参数;基于待测模型文件、硬件设备参数和测试参数,生成待测模型;基于测试数据信息,对待测模型进行测试,得到测试结果;向客户端发送测试结果。通过上述方法,能够将测试用户与支持模型运行的硬件完全隔离,并能自动生成测试所需的代码模板和测试服务,极大地提高了测试用户对待测模型测试地易用性,减少了测试人员的工作量,提高测试效率。
-
公开(公告)号:CN117076335B
公开(公告)日:2024-04-02
申请号:CN202311343167.3
申请日:2023-10-17
Applicant: 北京大学
IPC: G06F11/36
Abstract: 本申请公开了一种模型测试方法、系统、介质及电子设备,方法包括:获取待测试模型的模型名称以及数据信息;根据数据信息和预先建立的数据管理器,确定待测试模型所需的测试数据集;根据模型名称和预先建立的服务管理器,确定待测试模型对应的目标测试服务组件;根据测试数据集以及目标测试服务组件进行测试,生成待测试模型的测试结果,并反馈至客户端进行展示。由于本申请通过预先建立的数据管理器和服务管理器分别对不同模型的测试数据集和测试服务组件进行统一管理,因此实际应用中在确定模型的模型名称以及数据信息的情况下,可自动化执行模型测试流程,从而简化了模型测试复杂度,提高了模型测试的复用性和灵活性,提升了模型测试效率。
-
公开(公告)号:CN116663648B
公开(公告)日:2024-04-02
申请号:CN202310444646.8
申请日:2023-04-23
Applicant: 北京大学
IPC: G06N3/09 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06V10/82 , G06V10/774 , G06V10/74 , G06V10/80 , G06V10/50 , G06V10/44 , G06V10/764
Abstract: 本申请涉及一种模型训练方法、装置、设备及存储介质,该方法在神经网络模型训练的过程中,引入第一特征空间,并获取当前训练图像在第一特征空间中的第一类特征,进一步计算第一类特征与第一特征组中各特征的相似度,得到第一相似度组,以第一相似度组校正与神经网络模型的第二特征空间相关的第二相似度组,使得校正后的校正相似度组关注到与当前训练图像属于相同语义类别但相似度较低的样本,从而缓解了不可靠样本带来的错误指导。
-
公开(公告)号:CN117407299A
公开(公告)日:2024-01-16
申请号:CN202311350449.6
申请日:2023-10-18
Applicant: 北京大学
IPC: G06F11/36
Abstract: 本申请涉及人工智能技术领域,具体提供一种模型测试方法,旨在解决面对不同测试需求时会有大量繁杂重复的工作,测试效率低下的问题。为此目的,本申请的模型测试方法应用于服务端,包括:接收客户端发送的待测模型文件、测试数据信息、待测模型的硬件设备参数和测试参数;基于待测模型文件、硬件设备参数和测试参数,生成待测模型;基于测试数据信息,对待测模型进行测试,得到测试结果;向客户端发送测试结果。通过上述方法,能够将测试用户与支持模型运行的硬件完全隔离,并能自动生成测试所需的代码模板和测试服务,极大地提高了测试用户对待测模型测试地易用性,减少了测试人员的工作量,提高测试效率。
-
公开(公告)号:CN117076282B
公开(公告)日:2023-12-15
申请号:CN202311335808.0
申请日:2023-10-16
Applicant: 北京大学
IPC: G06F11/34
Abstract: 本发明涉及一种硬件算子时间性能的检测方法及装置,方法包括:获取待检测算子函数的函数名称和输入参数,调用算子检测的通用过程代理中的初始化方法,初始化所需的硬件设备以及所述输入参数;调用算子检测的通用过程代理中的开始计时方法进行计时,并基于所述待检测算子函数的函数名称和初始化后的输入参数,调用扩展功能代理中的目标扩展操作函数以及算子执行映射代理中的目标算子执行函数,执行待检测算子函数的操作;调用算子检测的通用过程代理中的结束计时方法结束计时,确定所述待检测算子函数在硬件设备的运行时间。基于此,提高算子检测的易用性、迁移性和灵活性。
-
公开(公告)号:CN117076282A
公开(公告)日:2023-11-17
申请号:CN202311335808.0
申请日:2023-10-16
Applicant: 北京大学
IPC: G06F11/34
Abstract: 本发明涉及一种硬件算子时间性能的检测方法及装置,方法包括:获取待检测算子函数的函数名称和输入参数,调用算子检测的通用过程代理中的初始化方法,初始化所需的硬件设备以及所述输入参数;调用算子检测的通用过程代理中的开始计时方法进行计时,并基于所述待检测算子函数的函数名称和初始化后的输入参数,调用扩展功能代理中的目标扩展操作函数以及算子执行映射代理中的目标算子执行函数,执行待检测算子函数的操作;调用算子检测的通用过程代理中的结束计时方法结束计时,确定所述待检测算子函数在硬件设备的运行时间。基于此,提高算子检测的易用性、迁移性和灵活性。
-
公开(公告)号:CN116107669A
公开(公告)日:2023-05-12
申请号:CN202310400779.5
申请日:2023-04-14
Applicant: 北京大学
Abstract: 本申请公开了一种深度学习框架的算子注册方法、装置、设备及存储介质,方法包括:获取待注册算子的信息,根据待注册算子的信息定义算子内核函数声明,算子内核函数声明中包括预设的形状输出函数;调用算子内核函数声明中预设的形状输出函数,得到输出的形状值,根据形状值定义算子内核函数,算子内核函数为一个compute函数;构造算子内核函数的多功能注册宏,根据多功能注册宏将待注册的算子内核函数注册到深度学习框架。本申请的算子注册方法,设计了算子内核函数注册接口,通过该接口,不同异构硬件的算子能够轻易的注册到深度学习框架中,同时减少了开发者在算子接入深度学习框架的代码开发量,减少开发者对深度学习框架自身结构的掌握程度。
-
公开(公告)号:CN112506666B
公开(公告)日:2024-08-23
申请号:CN202011525125.8
申请日:2020-12-22
Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。
-
公开(公告)号:CN117076335A
公开(公告)日:2023-11-17
申请号:CN202311343167.3
申请日:2023-10-17
Applicant: 北京大学
IPC: G06F11/36
Abstract: 本申请公开了一种模型测试方法、系统、介质及电子设备,方法包括:获取待测试模型的模型名称以及数据信息;根据数据信息和预先建立的数据管理器,确定待测试模型所需的测试数据集;根据模型名称和预先建立的服务管理器,确定待测试模型对应的目标测试服务组件;根据测试数据集以及目标测试服务组件进行测试,生成待测试模型的测试结果,并反馈至客户端进行展示。由于本申请通过预先建立的数据管理器和服务管理器分别对不同模型的测试数据集和测试服务组件进行统一管理,因此实际应用中在确定模型的模型名称以及数据信息的情况下,可自动化执行模型测试流程,从而简化了模型测试复杂度,提高了模型测试的复用性和灵活性,提升了模型测试效率。
-
公开(公告)号:CN116185426B
公开(公告)日:2023-09-19
申请号:CN202310402545.4
申请日:2023-04-17
Applicant: 北京大学
Abstract: 本申请涉及一种基于代码融合的编译优化方法、系统及电子设备。所述方法包括:针对包含有主机代码和内核代码的异构源程序,分别用编译器对主机代码和内核代码进行编译,得到分别与主机代码和内核代码对应的第一中间表示和第二中间表示;基于第一中间表示依次创建主机代码的控制流图和数据流图,基于第二中间表示依次创建内核代码的控制流图和数据流图;将主机代码的控制流图和内核代码的控制流图融合,将主机代码的数据流图和内核代码的数据流图融合,得到异构源程序的全局细粒度依赖关系图;针对异构源程序的全局细粒度依赖关系图中的多个内核节点,将多个内核节点融合。本申请将多个内核节点融合,大幅提升了编译性能。
-
-
-
-
-
-
-
-
-