用于生成伪结构光照射面部的方法、系统及存储介质

    公开(公告)号:CN112639802B

    公开(公告)日:2024-06-28

    申请号:CN201980052135.3

    申请日:2019-09-03

    Inventor: 林袁 何朝文

    Abstract: 在一实施方式中,方法包括:使用通过至少第一结构光产生的第一图像和通过至少第二结构光产生的第二图像来确定空间光照分布,其中,第一图像的一部分是所述至少第一结构光的一部分行进第一距离产生的,第二图像的一部分是所述至少第二结构光的一部分行进第二距离产生的,所述第一图像的该部分和所述第二图像的该部分产生空间光照分布的同一部分,并且所述第一距离不同于所述第二距离;构建第一3D面部模型;使用所述空间光照分布来渲染所述第一3D面部模型,以生成第一经渲染的3D面部模型;以及将所述第一经渲染的3D面部模型显示给第一摄像装置。

    文本识别方法、文本识别装置、介质与电子设备

    公开(公告)号:CN118015604A

    公开(公告)日:2024-05-10

    申请号:CN202211407144.X

    申请日:2022-11-10

    Abstract: 本公开提供一种文本识别方法、文本识别装置、计算机可读存储介质与电子设备,涉及文本识别技术领域。文本识别方法包括:获取视频流中的待识别帧;在获取到参考帧的文本位置信息的情况下,基于所述参考帧的文本位置信息,以及所述待识别帧与所述参考帧的关系,确定所述待识别帧的文本位置信息;所述参考帧是所述视频流中已检测到文本的帧;根据所述待识别帧的文本位置信息,得到所述待识别帧的文本识别结果。本公开能够对视频流中的文本进行准确、高效的识别。

    利用深度信息识别语音的方法、系统及计算机可读介质

    公开(公告)号:CN112639964B

    公开(公告)日:2024-07-26

    申请号:CN201980052681.7

    申请日:2019-08-27

    Inventor: 林袁 何朝文

    Abstract: 在一种实施方式中,方法包括:接收多个第一图像,所述多个第一图像包括说出话语的说话人的至少一个口相关部,每个第一图像具有深度信息;利用所述多个第一图像提取多个视位特征,其中,所述多个视位特征中的一个视位特征是利用所述多个第一图像中的一个第一图像的深度信息中所述说话者的舌头的深度信息获得的;利用所述多个视位特征确定与所述说出的话语相对应的词语序列,所述词语序列包括至少一个词语;以及通过人机界面(HMI)输出模型利用所述词语序列来输出响应。

    深度摄像头系统
    4.
    发明授权

    公开(公告)号:CN112997121B

    公开(公告)日:2022-11-11

    申请号:CN201980070909.5

    申请日:2019-09-11

    Inventor: 林袁 何朝文

    Abstract: 本申请公开了一种电子设备深度摄像头系统。该深度摄像头系统的面朝外的光学部件的数量减少。包括基本深度摄像头系统以及RGB‑D摄像头系统的单目深度摄像头系统在设备的壳体面板上具有正好一个窗口。光可通过该窗口从设备壳体透射出去以及透射到设备壳体内。光发射器和检测器都位于设备壳体内。双目RGB‑D摄像头系统在壳体面板上具有正好两个面朝外的光学部件。一个部件例如是光发射器或出射窗,与离开设备的照射光相关。而另一个光学部件是与将检测光透射到壳体内相关的入射窗。

    使用半球形或球形可见光深度图像的三维建模

    公开(公告)号:CN113424524A

    公开(公告)日:2021-09-21

    申请号:CN201980091640.9

    申请日:2019-09-05

    Inventor: 林袁 邓凡 何朝文

    Abstract: 三维建模包括获得半球形可见光深度图像(该半球形可见光深度图像捕获用户设备的操作环境),生成视角转换的半球形可见光深度图像,基于视角转换的半球形可见光深度图像生成操作环境的三维模型,以及输出三维模型。获得半球形可见光深度图像包括获得半球形可见光图像和获得半球形不可见光深度图像。生成视角转换的半球形可见光深度图像包括生成视角转换的半球形可见光图像和生成视角转换的半球形不可见光深度图像。

    使用深度信息净化声音的方法和系统以及计算机可读介质

    公开(公告)号:CN112567455B

    公开(公告)日:2024-05-17

    申请号:CN201980052488.3

    申请日:2019-08-22

    Abstract: 在一实施例中,方法包括:接收多个第一图像,多个所述第一图像至少包括发出声音的人的与嘴相关的部分,且每一所述第一图像均具有深度信息;获取噪声谱,所述噪声谱包括人的声音的第一表示;使用所述第一图像提取多个视觉特征,多个所述视觉特征中的一个通过使用多个所述第一图像中的第二图像的深度信息获得;使用所述噪声谱提取多个音频特征;使用所述视觉特征和所述音频特征确定第一谱;从所述噪声谱中减去所述第一谱,以获得人的声音的净化表示;以及驱使与输入/输出相关的输出设备使用人的声音的净化表示输出响应。

    使用深度图像的三维定位

    公开(公告)号:CN113412614B

    公开(公告)日:2023-02-14

    申请号:CN201980091507.3

    申请日:2019-09-17

    Inventor: 林袁 邓凡 何朝文

    Abstract: 描述了使用光深度图像进行三维定位的系统和方法。例如,一些方法包括:访问光深度图像,其中,光深度图像包括深度通道和一个或多个光通道,深度通道表示从图像捕获设备观看到的场景中的对象的距离,上述一个或多个光通道在时间和空间上与深度通道同步;基于光深度图像确定场景的特征集;访问地图数据结构,该地图数据结构包括基于空间中的对象的光数据和位置数据的特征;将场景的特征集与地图数据结构的特征子集进行匹配;基于将场景的特征集与地图数据结构的特征子集进行匹配,确定图像捕获设备相对于空间中的对象的位置。

    红外投影仪,成像设备和终端设备

    公开(公告)号:CN112424673B

    公开(公告)日:2023-01-31

    申请号:CN201980046844.0

    申请日:2019-08-22

    Inventor: 林袁 何朝文

    Abstract: 本发明提供了一种红外投影仪、成像设备以及终端设备。该红外投影仪包括红外源、光反射部、滤光部和至少一个驱动部件。红外源被配置为发射红外光。光反射部被配置为接收和反射来自红外源的红外光。滤光部被配置为接收光反射部所反射的红外光。该至少一个驱动部件被配置为驱动光反射部和滤光部的至少一个进行移动。

    深度摄像头系统
    9.
    发明公开

    公开(公告)号:CN112997121A

    公开(公告)日:2021-06-18

    申请号:CN201980070909.5

    申请日:2019-09-11

    Inventor: 林袁 何朝文

    Abstract: 本申请公开了一种电子设备深度摄像头系统。该深度摄像头系统的面朝外的光学部件的数量减少。包括基本深度摄像头系统以及RGB‑D摄像头系统的单目深度摄像头系统在设备的壳体面板上具有正好一个窗口。光可通过该窗口从设备壳体透射出去以及透射到设备壳体内。光发射器和检测器都位于设备壳体内。双目RGB‑D摄像头系统在壳体面板上具有正好两个面朝外的光学部件。一个部件例如是光发射器或出射窗,与离开设备的照射光相关。而另一个光学部件是与将检测光透射到壳体内相关的入射窗。

    使用半球形或球形可见光深度图像的三维建模

    公开(公告)号:CN113424524B

    公开(公告)日:2023-02-14

    申请号:CN201980091640.9

    申请日:2019-09-05

    Inventor: 林袁 邓凡 何朝文

    Abstract: 三维建模包括获得半球形可见光深度图像(该半球形可见光深度图像捕获用户设备的操作环境),生成视角转换的半球形可见光深度图像,基于视角转换的半球形可见光深度图像生成操作环境的三维模型,以及输出三维模型。获得半球形可见光深度图像包括获得半球形可见光图像和获得半球形不可见光深度图像。生成视角转换的半球形可见光深度图像包括生成视角转换的半球形可见光图像和生成视角转换的半球形不可见光深度图像。

Patent Agency Ranking