Patent search ap:("北京大学") AND inv:"刘宏" Page 7

61.

发明公开
一种基于优化机制的三维人体姿态估计方法及系统审中-实审

公开(公告)号：CN118537891A

公开(公告)日：2024-08-23

申请号：CN202410589241.8

申请日：2024-05-13

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 王体 , 游盈萱 , 王国权 , 李文豪

IPC: G06V40/10 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/09

Abstract: 本发明涉及一种基于优化机制的三维人体姿态估计方法及系统。该方法将二维姿态检测器从待估计图像中提取的二维骨架信息用于初始化一个隐藏变量；将隐藏变量送入预训练的三维人体姿态估计模型，输出三维骨架；用相机内参数将三维骨架投影到二维平面，计算投影损失；用投影损失优化隐藏变量，迭代多次；最后将优化后的隐藏变量作为训练好的三维人体姿态估计模型的输入，输出得到三维人体姿态估计结果。本发明结合了预训练的三维人体姿态估计模型和优化策略的优势，在推理阶段采用投影约束保证生成的姿态在二维空间上是对齐的，有效地保证生成的三维人体姿态更加真实可靠。

62.

发明授权
一种基于时空信息聚合的对比自监督人体行为识别方法及系统有权

公开(公告)号：CN115019397B

公开(公告)日：2024-04-19

申请号：CN202210680841.6

申请日：2022-06-15

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 郭天宇 , 丁润伟

IPC: G06V40/20 , G06N3/0464 , G06N3/09 , G06V10/764 , G06V10/774 , G06V10/82

Abstract: 本发明涉及一种基于时空信息聚合的对比自监督人体行为识别方法及系统。该方法对输入的骨架动作序列进行数据增强得到增强后的两个动作序列；利用第一编码器和第二编码器即动量更新编码器将其编码成特征向量；利用预测器得到另一组特征向量，通过损失函数构造有效的单个数据流的特征空间。进一步地，计算骨架序列的运动信息和骨骼信息，并同样作为上述步骤的输入，并在得到特征之后计算特征相似度，数据流内部的相似度矩阵做尖锐处理，并在不同数据流间投票融合，得到相似度伪标签，将时空信息有效聚合后约束单个数据流的分布，来训练更优的模型。本发明训练得到的模型可以在实际应用中取得很好的行为识别效果。

63.

发明公开
基于Transformer的视听融合机器人唤醒词识别方法及装置审中-实审

公开(公告)号：CN116229939A

公开(公告)日：2023-06-06

申请号：CN202310091543.8

申请日：2023-01-29

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 李一迪 , 任家乐

IPC: G10L15/02 , G10L15/16 , G10L15/26 , G06V20/40 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08

Abstract: 本公开涉及一种基于Transformer的视听融合机器人唤醒词识别方法及装置，涉及音视频信号处理领域。所述方法包括：提取当前环境下的音频特征和视频特征；基于Transformer的分类网络的自注意力操作和分类操作，分别获取音频特征和视频特征的音频唤醒词分类向量与视频唤醒词分类向量；基于音频特征进行自注意力操作时在时间维度上的注意力权重分布，得到唤醒词出现的时间。本发明不仅实现了高精度、鲁棒的基于分类的唤醒词识别，还可以精确定位唤醒词出现的时间。

64.

发明公开
一种基于图多层感知器的三维人体姿态估计方法及系统审中-实审

公开(公告)号：CN115205896A

公开(公告)日：2022-10-18

申请号：CN202210738751.8

申请日：2022-06-24

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 李文豪 , 丁润伟

IPC: G06V40/10 , G06V10/82 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种基于图多层感知器的三维人体姿态估计方法及系统。该方法对输入的训练图像通过二维姿态检测器提取人体的二维骨架信息；利用骨架嵌入模块编码骨架成高维向量；利用图多层感知器模型来提取高维语义特征；利用预测头模块来回归得到三维骨架；利用均方误差损失函数训练模型。本发明结合了图卷积和多层感知器的优势，不需要复杂的自注意力机制，便可很好地提升骨架的表征学习能力。

65.

发明公开
一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统有权

公开(公告)号：CN114092873A

公开(公告)日：2022-02-25

申请号：CN202111271643.6

申请日：2021-10-29

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 石伟 , 丁润伟

IPC: G06V20/52 , G06V40/10 , G06V10/46 , G06V10/778 , G06K9/62

Abstract: 本发明涉及一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统。该方法对输入的训练图像通过人体稠密解析估计和边缘估计提取人体轮廓图像，求取训练图像与人体轮廓图像的残差，得到人体外观图像；利用形态表征模型对人体轮廓图像进行高级语义特征提取，利用外观表征模型对人体外观图像进行高级语义特征提取；利用三元组损失函数和识别损失函数训练外观表征模型和形态表征模型，采用学习的两个表征模型对待查询行人图像和候选行人图像提取形态特征和外观特征，通过计算相似性得分得到跨摄像头场景中的关联目标。本发明不需要采用复杂的对抗学习模型就能提取行人的形态信息，并可避免挖掘涉及隐私的人脸信息及不可靠的行人步态信息。

66.

发明授权
一种基于先验候选框选择策略的行人搜索方法和装置有权

公开(公告)号：CN109165540B

公开(公告)日：2022-02-25

申请号：CN201810608363.1

申请日：2018-06-13

Applicant: 深圳市感动智能科技有限公司 , 北京大学深圳研究生院

Inventor： 丁润伟 , 石伟 , 刘宏

IPC: G06V40/10 , G06V10/762 , G06K9/62

67.

发明授权
一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统失效

公开(公告)号：CN110517705B

公开(公告)日：2022-02-18

申请号：CN201910808413.5

申请日：2019-08-29

Applicant: 北京大学深圳研究生院

Inventor： 刘宏 , 庞程 , 丁润伟 , 吴璐璐 , 孙永恒

IPC: G10L25/30 , G10L25/51 , G01S5/20

Abstract: 本发明公开了一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统，首先对双耳声音信号提取双耳能量差和互相关函数；接着将提取的双耳能量差和互相关函数输入训练完成的级联神经网络，在深度神经网络分支中判别声音源的方向，在卷积神经网络中提取声音源前后向区分的细节信息，得出声音源在机器人头部前半平面或后半平面的信息；最后，综合深度神经网络和卷积神经网络的输出结果，得出最终的定位结果。本发明能够在一定程度上抵抗噪声和混响的干扰，完成声源前后向及角度的判别问题，实现全向声源定位。

68.

发明授权
人脸左右倾斜角度估计方法、系统、设备及存储介质有权

公开(公告)号：CN108960099B

公开(公告)日：2021-07-06

申请号：CN201810653661.2

申请日：2018-06-22

Applicant: 哈尔滨工业大学深圳研究生院 , 北京大学深圳研究生院

Inventor： 徐勇 , 刘宏

IPC: G06K9/00 , G06K9/62

Abstract: 本发明公开了一种人脸左右倾斜角度的估计方法、系统、设备及存储介质，包括以下步骤：将人脸图像以指定方式均分为第一图像和第二图像；计算所述第一图像与第二图像之间的像素值的相对差异值；根据所述相对差异值计算出对应的人脸左右倾斜角度。本发明的人脸左右倾斜角度的估计方法、系统、设备及存储介质的有益效果为：通过根据像素值的相对差异值计算出对应的人脸左右倾斜角度，简化了人脸倾斜角度估计的步骤，提高了人脸左右倾斜角度计算速度和有效地避免了光照变化的影响。

69.

发明公开
基于小目标搜索缩放技术的水下目标检测方法和系统有权

公开(公告)号：CN112419227A

公开(公告)日：2021-02-26

申请号：CN202011096905.5

申请日：2020-10-14

Applicant: 北京大学深圳研究生院 , 鹏城实验室

Inventor： 刘宏 , 宋品皓 , 丁润伟 , 戴林辉

IPC: G06T7/00 , G06T5/50 , G06T3/40 , G06T7/13 , G06N3/04

Abstract: 本发明涉及一种基于小目标搜索缩放技术的水下目标检测方法和系统。该方法的步骤为：将待检测图片输入至目标检测网络Faster‑RCNN+FPN，得到第一检测结果；提取FPN中特征图的热力图，并提取FPN中特征图的边缘图，将热力图和边缘图进行结合，得到综合热力图；在综合热力图上进行搜索，找到激活值之和最大的窗口，提取待检测图片中该窗口内的图片并输入目标检测网络，得到第二检测结果；将第一检测结果和第二检测结果进行决策融合，得到最终的目标检测结果。本发明通过分析FPN激活值对原图进行缩放，关注密集小目标部分，从而进行多尺度推断，能够提高模型对小目标的检测能力。

70.

发明授权
一种基于目标识别的室内建图与定位方法有权

公开(公告)号：CN107358629B

公开(公告)日：2020-11-10

申请号：CN201710549596.4

申请日：2017-07-07

Applicant: 北京大学深圳研究生院 , 深圳市银星智能科技股份有限公司

Inventor： 刘宏 , 马佳瑶 , 宋章军 , 张国栋 , 赵晨阳 , 吴观明

IPC: G06T7/73

Abstract: 本发明涉及一种基于目标识别的室内定位与建图方法，其步骤包括：1)输入颜色深度图像，根据颜色深度图像建立目标物体模型数据库；2)输入实时测量的颜色深度图像，将其转换成3D点云，并求出当前视角能看到的场景表面；3)根据3D点云并基于最近迭代点估计相机的姿态；4)根据3D点云和建立的目标物体模型数据库，利用点对特征进行物体识别并估计物体的姿态；5)利用相机姿态和物体姿态优化姿态图；6)根据姿态图得到最优的物体姿态，利用已知的目标物体模型数据库进行表面渲染，得到当前环境的三维地图。本发明能在具有大量物体的场景下进行室内定位和地图建立，建图精度高，所用计算资源少。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification