-
公开(公告)号:CN112748998B
公开(公告)日:2023-10-03
申请号:CN202110081461.6
申请日:2021-01-21
Applicant: 中南大学
IPC: G06F9/48 , G06F9/50 , G06T1/20 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种移动端的卷积神经网络任务调度方法及系统,方法包括:S1.针对计算任务,从预设的配置方案集合中选择满足预设条件的配置方案,配置方案包括CPU核心频率、GPU核心频率、最低网络延迟切分比率、和当前配置参数下的最低网络延迟;S2.将计算任务的卷积层输入张量按照最低网络延迟切分比率进行切分,切分得到CPU输入张量和GPU输入张量;S3.以CPU输入张量作为CPU卷积神经网络的输入,计算得到CPU输出张量;以GPU输入张量作为GPU卷积神经网络的输入,计算得到GPU输出张量,根据CPU输出张量和GPU输出张量得到卷积神经网络的输出张量。具有有效降低移动端卷积神经网络延迟等优点。
-
公开(公告)号:CN112748998A
公开(公告)日:2021-05-04
申请号:CN202110081461.6
申请日:2021-01-21
Applicant: 中南大学
Abstract: 本发明公开了一种移动端的卷积神经网络任务调度方法及系统,方法包括:S1.针对计算任务,从预设的配置方案集合中选择满足预设条件的配置方案,配置方案包括CPU核心频率、GPU核心频率、最低网络延迟切分比率、和当前配置参数下的最低网络延迟;S2.将计算任务的卷积层输入张量按照最低网络延迟切分比率进行切分,切分得到CPU输入张量和GPU输入张量;S3.以CPU输入张量作为CPU卷积神经网络的输入,计算得到CPU输出张量;以GPU输入张量作为GPU卷积神经网络的输入,计算得到GPU输出张量,根据CPU输出张量和GPU输出张量得到卷积神经网络的输出张量。具有有效降低移动端卷积神经网络延迟等优点。
-
公开(公告)号:CN111131835B
公开(公告)日:2021-02-26
申请号:CN201911410027.7
申请日:2019-12-31
Applicant: 中南大学
IPC: H04N19/42 , H04N19/132 , H04N19/13 , H04N19/625
Abstract: 本发明公开了一种视频处理方法及系统,方法包括:S1.将待处理视频中的帧进行分组,得到帧编组,并将所述帧编组内的帧划分为基础帧和变化帧;S2.以延时最小作为优化目标,确定所述帧编组内的所述基础帧和所述变化帧的处理主体,并将其分配给所确定的所述处理主体;所述处理主体包括本地端和服务端;S3.通过所述处理主体对所述基础帧和所述变化帧进行识别,得到识别结果。具有可有效降低识别的延时,同时保证识别准确率的优点。
-
公开(公告)号:CN112084958B
公开(公告)日:2024-05-10
申请号:CN202010952910.5
申请日:2020-09-11
Applicant: 中南大学
Abstract: 本发明公开了一种移动端的多人人体骨架识别方法及装置,方法包括:S1.从视频中解码获取图像帧;S2.从所述图像帧中识别出人体区域,生成人体子图;S3.将所述人体子图进行识别调度,分配给所述移动端的CPU和/或GPU进行识别,通过所述CPU和/或GPU分别运行预设的骨架识别模型,识别出人体骨架。本发明具有识别速度快、延迟低,识别精度高等优点。
-
公开(公告)号:CN112084958A
公开(公告)日:2020-12-15
申请号:CN202010952910.5
申请日:2020-09-11
Applicant: 中南大学
Abstract: 本发明公开了一种移动端的多人人体骨架识别方法及装置,方法包括:S1.从视频中解码获取图像帧;S2.从所述图像帧中识别出人体区域,生成人体子图;S3.将所述人体子图进行识别调度,分配给所述移动端的CPU和/或GPU进行识别,通过所述CPU和/或GPU分别运行预设的骨架识别模型,识别出人体骨架。本发明具有识别速度快、延迟低,识别精度高等优点。
-
公开(公告)号:CN111131835A
公开(公告)日:2020-05-08
申请号:CN201911410027.7
申请日:2019-12-31
Applicant: 中南大学
IPC: H04N19/42 , H04N19/132 , H04N19/13 , H04N19/625
Abstract: 本发明公开了一种视频处理方法及系统,方法包括:S1.将待处理视频中的帧进行分组,得到帧编组,并将所述帧编组内的帧划分为基础帧和变化帧;S2.以延时最小作为优化目标,确定所述帧编组内的所述基础帧和所述变化帧的处理主体,并将其分配给所确定的所述处理主体;所述处理主体包括本地端和服务端;S3.通过所述处理主体对所述基础帧和所述变化帧进行识别,得到识别结果。具有可有效降低识别的延时,同时保证识别准确率的优点。
-
-
-
-
-