一种基于代码融合的编译优化方法、系统及电子设备

    公开(公告)号:CN116185426A

    公开(公告)日:2023-05-30

    申请号:CN202310402545.4

    申请日:2023-04-17

    Applicant: 北京大学

    Abstract: 本申请涉及一种基于代码融合的编译优化方法、系统及电子设备。所述方法包括:针对包含有主机代码和内核代码的异构源程序,分别用编译器对主机代码和内核代码进行编译,得到分别与主机代码和内核代码对应的第一中间表示和第二中间表示;基于第一中间表示依次创建主机代码的控制流图和数据流图,基于第二中间表示依次创建内核代码的控制流图和数据流图;将主机代码的控制流图和内核代码的控制流图融合,将主机代码的数据流图和内核代码的数据流图融合,得到异构源程序的全局细粒度依赖关系图;针对异构源程序的全局细粒度依赖关系图中的多个内核节点,将多个内核节点融合。本申请将多个内核节点融合,大幅提升了编译性能。

    基于弱监督信息的深度学习图像目标映射及定位方法

    公开(公告)号:CN108764292A

    公开(公告)日:2018-11-06

    申请号:CN201810390879.3

    申请日:2018-04-27

    Applicant: 北京大学

    Abstract: 本发明提供了一种基于弱监督信息的深度学习图像目标映射及定位方法。该方法包括:使用带有类别标签的图像数据分别训练两个深度卷积神经网络框架,得到分类模型M1和分类模型M2,并获取全局带参可学习池化层参数;使用新的分类模型M2对测试图像进行特征提取,得到特征图,根据特征图通过特征类别映射及阈值法得到初步定位框;使用选择性搜索方法对测试图像进行候选区域提取,使用分类模型M1筛选类别出候选框集合;对初步定位框和候选框进行非极大值抑制处理,得到测试图像最终的目标定位框。本发明引入全局带参可学习池化层,能够学习得到关于目标类别j的更好的特征表达,并通过使用选择性特征类别映射的方式,有效得到图像中目标物体的位置信息。

    利用瑞士轮排序进行步态识别的行人再标识方法和装置

    公开(公告)号:CN104537356A

    公开(公告)日:2015-04-22

    申请号:CN201510014586.1

    申请日:2015-01-12

    Applicant: 北京大学

    CPC classification number: G06K9/00348

    Abstract: 本发明实施例提供了一种利用瑞士轮排序进行步态识别的行人再标识方法和装置。该方法包括:检测待检测视频中的行人的目标对象,提取所述目标对象的前景、步态周期和步态特征;将目标对象的步态特征和候选数据的步态特征进行相似性分析得到待排序数据;使用训练好的瑞士轮排序系统,将待排序数据进行多层次的分组排序,组合多层次的分组排序的结果得到待排序数据的最终排序结果,将目标对象识别为最终排序结果中排名最靠前的候选数据。本发明实施例能有效适应步态在多种情况下差异较大的问题,提高了监控视频场景中对象再标识的准确性,降低误检,实现了有效的行人检测和再标识任务。

    一种硬件测试方法、系统、设备和存储介质

    公开(公告)号:CN119512832A

    公开(公告)日:2025-02-25

    申请号:CN202411361269.2

    申请日:2024-09-27

    Applicant: 北京大学

    Abstract: 本发明公开一种硬件测试方法、系统、设备和存储介质,所述方法包括:根据待测试的模型或算法生成对应的计算图的子图序列;所述计算图用于表征模型或算法的数据结构;所述计算图由若干节点和边组成,所述节点表征模型或算法的计算步骤,所述边表征计算步骤之间的逻辑关系;基于子图序列之间的调用顺序确定出子图执行序列和执行位置;按照所述子图执行序列,将子图输入硬件对应的执行位置进行计算,得到硬件性能指标。通过自动化地从模型或算法生成计算图的子图序列,并确定执行序列和位置,不仅提高了硬件性能测试的效率和准确性,还使得测试结果更加可靠,有助于全面评估和优化硬件资源的使用。

    一种算子检测方法、装置以及计算机设备

    公开(公告)号:CN116629330B

    公开(公告)日:2024-04-16

    申请号:CN202310451059.1

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本公开提供了一种算子检测方法、装置以及计算机设备,其中,该方法包括:获取神经网络模型的模型文件;基于所述模型文件确定神经网络模型中各网络层的结构描述信息;对每个所述网络层的结构描述信息进行遍历,得到每个所述网络层的算子信息,并基于每个所述网络层的算子信息生成目标算子列表;所述算子信息用于指示各网络层中算子的属性信息和算子之间的依赖关系;对所述目标算子列表进行检查,得到检查结果;通过所述检查结果确定能够通过所述神经网络模型的硬件设备执行相应计算操作的算子。

    硬件设备注册方法、装置、设备及存储介质

    公开(公告)号:CN116185371A

    公开(公告)日:2023-05-30

    申请号:CN202310448879.5

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本申请涉及一种硬件设备注册方法、装置、设备及存储介质,该方法通过确定待注册硬件设备匹配的设备类型,实现了将待注册硬件设备的目标功能注册到算法框架中。可见采用本申请的方案,无需编写支持该算法框架的接入代码并重新编译框架代码,提高了硬件设备接入算法框架的效率。

    一种支持多视点视频合成的网络流媒体播放器及方法

    公开(公告)号:CN100559877C

    公开(公告)日:2009-11-11

    申请号:CN200710098823.2

    申请日:2007-04-27

    Applicant: 北京大学

    Abstract: 本发明涉及一种支持多视点视频合成的网络流媒体播放器,它包括一个数据接收模块和一个呈现模块,其特征在于:它还包括一个以上解码模块和一个合成模块;所述数据接收模块通过一条以上IP连接接收压缩视频码流,并将所接收数据向一个以上解码模块转发,此外它还从用户界面接收视点切换命令并向合成模块转发;所述解码模块从数据接收模块接收压缩视频帧数据并解码,并向合成模块转发解码后的原始视频帧数据;所述合成模块从一个以上解码模块接收原始视频帧数据并进行虚拟视合成,另一方面将合成结果向呈现模块转发,此外它还从数据接收模块接收视点切换命令;所述呈现模块从合成模块接收虚拟视频帧并向显示设备进行转发。本发明能够在一个播放器框架下同时与流媒体服务器建立多条网络连接并同时接收和解码多个视频码流。

    算子的自动检测方法、装置、电子设备及介质

    公开(公告)号:CN115934346B

    公开(公告)日:2023-10-20

    申请号:CN202211689392.8

    申请日:2022-12-28

    Applicant: 北京大学

    Abstract: 本申请公开了一种算子的自动检测方法、装置、电子设备及介质。通过应用本申请的技术方案,可以实现一种能够对待检测算子在不同计算设备下的算子支撑能力的自动测试。通过待检测算子在计算精度、计算效率与标准结果的能力对比来获得算子在不同场景下的计算能力判断。从而达到避免相关技术中出现的,无法为不同硬件设备或不同应用功能应用所需算子的问题。

    硬件设备注册方法、装置、设备及存储介质

    公开(公告)号:CN116185371B

    公开(公告)日:2023-09-19

    申请号:CN202310448879.5

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本申请涉及一种硬件设备注册方法、装置、设备及存储介质,该方法通过确定待注册硬件设备匹配的设备类型,实现了将待注册硬件设备的目标功能注册到算法框架中。可见采用本申请的方案,无需编写支持该算法框架的接入代码并重新编译框架代码,提高了硬件设备接入算法框架的效率。

Patent Agency Ranking