-
公开(公告)号:CN118211664A
公开(公告)日:2024-06-18
申请号:CN202410393447.3
申请日:2024-04-02
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于自适应分区部署的多深度神经网络应用分布式推理方法,所述方法包括如下步骤:步骤S1、分布式DNN应用推理建模;步骤S2、DNN推理运行数据收集;步骤S3、DNN自适应分区方案优化;步骤S4、DNN多实例部署方案优化;步骤S5、DNN分区部署自适应调整。本发明适用于支持多个不同的复杂DNN以及分布式异构的边缘计算环境,通过对DNN、计算环境以及端到端延迟进行建模,结合遗传算法与分层强化学习算法对DNN进行分区与部署,从而优化其推理延迟进行优化,最终生成DNN的分区方案以及部署方案,实现高效的DNN分布式推理。
-
公开(公告)号:CN111460788A
公开(公告)日:2020-07-28
申请号:CN202010252382.2
申请日:2020-04-01
IPC: G06F40/211 , G06F40/242 , G06F40/284 , G16H15/00
Abstract: 本发明公开了一种CT/PET报告的交互式阅读方法,所述方法通过对CT/PET报告进行处理,结合计算机仿真3D人体模型,使医生可以在计算机上通过点击计算机仿真3D人体模型上的人体器官部位,交互式快速查看对应部位的CT/PET报告中的内容描述。本发明通过计算机仿真3D人体模型解决,既可以非常形象直观的呈现报告内容,又不需要报告中集合原始的图片信息或者其他多媒体信息;通过与计算机仿真3D人体模型交互操作,可以快速根据想要查看的病灶突出显示报告中有关信息。
-
公开(公告)号:CN119046598B
公开(公告)日:2025-04-11
申请号:CN202411248876.8
申请日:2024-09-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了基于NPU的CoppersmithWinograd矩阵乘法加速方法,属于混合编程技术领域。解决了现有技术中不存在用于昇腾芯片的采用开源混合编程算子实现快速矩阵乘法方法的问题;本发明设计了Ascend_CoppersmithWinograd算子数据通路,对输入矩阵进行数据搬运并切分,得到分块矩阵;进行第一次矩阵间加减运算,得到矩阵乘法阶段的输入数据,对部分分块矩阵进行加零操作,得到转换后的矩阵;进行矩阵乘法运算,得到矩阵乘法结果;进行第二次矩阵间加减运算,得到子矩阵;对子矩阵进行数据搬运并合并,得到输出矩阵。本发明有效缩短了矩阵运算时间,提高了计算精度,可以应用于昇腾芯片混合编程。
-
公开(公告)号:CN118261874A
公开(公告)日:2024-06-28
申请号:CN202410359722.X
申请日:2024-03-27
Applicant: 哈尔滨工业大学
IPC: G06T7/00 , G06T7/11 , G06V10/764 , G06T7/194 , G06T7/13
Abstract: 本发明公开了一种基于图像分割大模型和多元高阶回归拟合的鱼竿钓性分析方法,所述方法包括如下步骤:步骤一、图像裁切;步骤二、鱼竿预识别;步骤三、图像识别;步骤四、鱼竿曲线拟合。该方法能够将图像中的鱼竿自动识别出来并生成鱼竿图像在原图中的坐标从而衡量鱼竿的钓性,支持在光线昏暗下分割图像,并且在处理大尺寸图像时仍有较高的效率和分割效果。
-
公开(公告)号:CN119046598A
公开(公告)日:2024-11-29
申请号:CN202411248876.8
申请日:2024-09-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了基于NPU的CoppersmithWinograd矩阵乘法加速方法,属于混合编程技术领域。解决了现有技术中不存在用于昇腾芯片的采用开源混合编程算子实现快速矩阵乘法方法的问题;本发明设计了Ascend_CoppersmithWinograd算子数据通路,对输入矩阵进行数据搬运并切分,得到分块矩阵;进行第一次矩阵间加减运算,得到矩阵乘法阶段的输入数据,对部分分块矩阵进行加零操作,得到转换后的矩阵;进行矩阵乘法运算,得到矩阵乘法结果;进行第二次矩阵间加减运算,得到子矩阵;对子矩阵进行数据搬运并合并,得到输出矩阵。本发明有效缩短了矩阵运算时间,提高了计算精度,可以应用于昇腾芯片混合编程。
-
公开(公告)号:CN119046599A
公开(公告)日:2024-11-29
申请号:CN202411248878.7
申请日:2024-09-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了基于NPU的Strassen矩阵乘法加速方法,属于混合编程技术领域。解决了现有技术中不存在用于昇腾芯片的采用开源混合编程算子实现快速矩阵乘法方法的问题;本发明设计了Ascend_Strassen算子数据通路,对输入矩阵进行数据搬运并切分,得到分块矩阵;根据分块矩阵,进行第一次矩阵间加减运算,得到矩阵乘法阶段的输入数据,对部分分块矩阵进行加零操作,得到转换后的矩阵;进行矩阵乘法运算,得到矩阵乘法结果;根据矩阵乘法结果,进行第二次矩阵间加减运算,得到子矩阵;对子矩阵进行数据搬运并合并,得到输出矩阵。本发明有效缩短了矩阵运算时间,提高了计算精度,可以应用于昇腾芯片混合编程。
-
公开(公告)号:CN118261874B
公开(公告)日:2024-08-23
申请号:CN202410359722.X
申请日:2024-03-27
Applicant: 哈尔滨工业大学
IPC: G06T7/00 , G06T7/11 , G06V10/764 , G06T7/194 , G06T7/13
Abstract: 本发明公开了一种基于图像分割大模型和多元高阶回归拟合的鱼竿钓性分析方法,所述方法包括如下步骤:步骤一、图像裁切;步骤二、鱼竿预识别;步骤三、图像识别;步骤四、鱼竿曲线拟合。该方法能够将图像中的鱼竿自动识别出来并生成鱼竿图像在原图中的坐标从而衡量鱼竿的钓性,支持在光线昏暗下分割图像,并且在处理大尺寸图像时仍有较高的效率和分割效果。
-
公开(公告)号:CN116402067A
公开(公告)日:2023-07-07
申请号:CN202310359660.8
申请日:2023-04-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种面向多语种的自监督跨语言文字风格保持生成方法,所述方法包括如下步骤:一、建立用于实现跨语言生成任务的条件生成对抗网络模型;二、条件生成对抗网络模型在多语言真实数据中进行自监督训练,且在自监督训练过程使用识别器和条件生成对抗网络模型联合训练,提升最终的风格文本图像可辨读性。本发明综合利用风格迁移、生成对抗网络、图像修复、场景文字擦除和图像文字识别等技术,面向多语种实施跨语言文字风格保持生成,将图像的文本内容修改为另一种语言的新文本,同时保留图像中文字风格和背景纹理,能够解决图像翻译后的结果面临替换前后文本风格不一致、背景纹理不协调等问题,给用户带来更好的图像翻译体验。
-
公开(公告)号:CN119046599B
公开(公告)日:2025-04-29
申请号:CN202411248878.7
申请日:2024-09-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了基于NPU的Strassen矩阵乘法加速方法,属于混合编程技术领域。解决了现有技术中不存在用于昇腾芯片的采用开源混合编程算子实现快速矩阵乘法方法的问题;本发明设计了Ascend_Strassen算子数据通路,对输入矩阵进行数据搬运并切分,得到分块矩阵;根据分块矩阵,进行第一次矩阵间加减运算,得到矩阵乘法阶段的输入数据,对部分分块矩阵进行加零操作,得到转换后的矩阵;进行矩阵乘法运算,得到矩阵乘法结果;根据矩阵乘法结果,进行第二次矩阵间加减运算,得到子矩阵;对子矩阵进行数据搬运并合并,得到输出矩阵。本发明有效缩短了矩阵运算时间,提高了计算精度,可以应用于昇腾芯片混合编程。
-
公开(公告)号:CN118274709B
公开(公告)日:2024-08-23
申请号:CN202410359726.8
申请日:2024-03-27
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于透视变换和鱼竿测量背景板的像素坐标转世界坐标方法,所述方法如下:一、在背板上粘贴两种不同半径大小的圆形标志点,通过大圆标志点的位置确定其余所有小圆标志点的世界坐标,实现对背景板上坐标的定位;二、通过识别鱼竿测量背景板上的所有圆形标志点,根据圆形标志点的面积判断大圆标志点的像素坐标,从而确定剩余小圆标志点的像素坐标;对小圆标志点排序后与鱼竿测量背景板进行比对确定其相对位置,并与世界坐标对应;三、通过找到转换点附近的六个背景板上的圆点,并根据这些点的坐标和特征点的排序计算透视变换矩阵;根据透视变换矩阵将输入的像素坐标转换为真实物体坐标。本发明能够提供更精确的位置信息和距离测量。
-
-
-
-
-
-
-
-
-