-
公开(公告)号:CN108874360B
公开(公告)日:2023-04-07
申请号:CN201810679316.6
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/16 , G06F3/04815 , G06V20/20
Abstract: 本发明实施例提出一种全景内容定位方法和装置。该方法包括:对输入的控制语音进行语义分析,以确定用户需求,用户需求包括用户需要操作的操作页面、操作对象和操作类型中的至少一项;如果用户需求为对全景内容的当前页面进行操作,则对所述当前页面进行图像识别,以在当前页面中查找是否有与操作对象匹配的实体;如果在当前页面中有与操作对象匹配的实体,则在当前页面中根据交互行为规则和操作类型操作匹配的实体。本发明实施例为给提供用户一种更自然、智能的交互体验,弥补了语音在全景浏览这一块的空白,节省用户的使用步长,更精准地满足用户需求。
-
公开(公告)号:CN108961422B
公开(公告)日:2023-02-14
申请号:CN201810677886.1
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T19/00 , G06V10/74 , G06V10/774
Abstract: 本发明实施例提出一种三维模型的标记方法和装置。该方法包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到待显示三维模型在待标记图像中的标记位置。本发明实施例针对不同类别的模型和图像场景准确地产生标记,有利于更加准确和自然地显示模型初始化位置,产生的标记也更加符合三维模型和待标记图像的特点。
-
公开(公告)号:CN108597034A
公开(公告)日:2018-09-28
申请号:CN201810401434.0
申请日:2018-04-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T19/00
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:基于预先获取的全景图像,构建三维全景空间;对目标物体图像进行解析,生成该目标物体图像的属性信息,确定与该属性信息相匹配的区域类型;从该三维全景空间中的、该区域类型所指示的区域中,确定待放置该目标物体图像的目标位置;将该目标物体图像放置于该三维全景空间的目标位置,生成三维全景图像。该实施方式提高了信息生成的灵活性。
-
公开(公告)号:CN108597034B
公开(公告)日:2022-11-01
申请号:CN201810401434.0
申请日:2018-04-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T19/00
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:基于预先获取的全景图像,构建三维全景空间;对目标物体图像进行解析,生成该目标物体图像的属性信息,确定与该属性信息相匹配的区域类型;从该三维全景空间中的、该区域类型所指示的区域中,确定待放置该目标物体图像的目标位置;将该目标物体图像放置于该三维全景空间的目标位置,生成三维全景图像。该实施方式提高了信息生成的灵活性。
-
公开(公告)号:CN108920707B
公开(公告)日:2022-03-15
申请号:CN201810803949.3
申请日:2018-07-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/583 , G06F16/58
Abstract: 本申请实施例公开了用于标注信息的方法及装置。该方法的一具体实施方式包括:从待标注全景图像中获取至少一张待识别对象图像;对于上述至少一张待识别对象图像中的待识别对象图像,查询包含该待识别对象图像的至少一张已标注图像,并根据上述至少一张已标注图像确定该待识别对象图像的标注信息;基于上述至少一张待识别对象图像中的待识别对象图像的标注信息,确定上述待标注全景图像的标注信息。该实施方式提高了获取待标注全景图像的标注信息的效率和准确性。
-
公开(公告)号:CN108920707A
公开(公告)日:2018-11-30
申请号:CN201810803949.3
申请日:2018-07-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请实施例公开了用于标注信息的方法及装置。该方法的一具体实施方式包括:从待标注全景图像中获取至少一张待识别对象图像;对于上述至少一张待识别对象图像中的待识别对象图像,查询包含该待识别对象图像的至少一张已标注图像,并根据上述至少一张已标注图像确定该待识别对象图像的标注信息;基于上述至少一张待识别对象图像中的待识别对象图像的标注信息,确定上述待标注全景图像的标注信息。该实施方式提高了获取待标注全景图像的标注信息的效率和准确性。
-
公开(公告)号:CN108874360A
公开(公告)日:2018-11-23
申请号:CN201810679316.6
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/16 , G06F3/0481 , G06K9/00
Abstract: 本发明实施例提出一种全景内容定位方法和装置。该方法包括:对输入的控制语音进行语义分析,以确定用户需求,用户需求包括用户需要操作的操作页面、操作对象和操作类型中的至少一项;如果用户需求为对全景内容的当前页面进行操作,则对所述当前页面进行图像识别,以在当前页面中查找是否有与操作对象匹配的实体;如果在当前页面中有与操作对象匹配的实体,则在当前页面中根据交互行为规则和操作类型操作匹配的实体。本发明实施例为给提供用户一种更自然、智能的交互体验,弥补了语音在全景浏览这一块的空白,节省用户的使用步长,更精准地满足用户需求。
-
公开(公告)号:CN108805970A
公开(公告)日:2018-11-13
申请号:CN201810413655.X
申请日:2018-05-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T15/50
CPC classification number: G06T15/506
Abstract: 本发明提出一种光照估计方法及装置,其中,光照估计方法包括:采用模拟光照模型对三维人脸模型进行仿真光照投射,渲染得到多张二维图片;为每张所述二维图片标注对应的所述模拟光照模型的光照参数;对所述二维图片进行人脸检测,截取检测到的人脸区域,得到二维人脸图片;根据多张所述二维人脸图片的像素采样值和所述二维人脸图片标注的所述光照参数,训练得到光照估计模型。该光照估计方法及装置,降低了光照参数的获取难度和成本,且能够覆盖所有可能的光照条件,提高了光照估计模型的精确度。
-
公开(公告)号:CN108536830B
公开(公告)日:2020-11-24
申请号:CN201810320783.X
申请日:2018-04-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/532
Abstract: 本发明实施例公开了一种图片动态搜索方法、装置、设备、服务器和存储介质,该方法包括:通过搜索获得目标对象的图片;确定所述目标对象的动作,并依据所述动作向服务端发送图像序列获取指令;其中,所述图像序列获取指令用于指示所述服务端获取目标对象执行所述动作所需的至少两帧序列图片;接收并展示所述服务端返回的所述至少两帧序列图片,使所述目标对象在搜索结果页面中执行所述动作。本发明实施例通过与用户的交互,在用户端以多个连续的图像帧的形式动态展现给用户搜索结果,提高了搜索结果的传输速度和展示效率,使服务端的3D模型得到了版权保护;同时给予用户可感知的交互反馈,增强用户对搜索结果的深层认知。
-
公开(公告)号:CN108961422A
公开(公告)日:2018-12-07
申请号:CN201810677886.1
申请日:2018-06-27
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06T19/006 , G06K9/6201 , G06K9/6256
Abstract: 本发明实施例提出一种三维模型的标记方法和装置。该方法包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到待显示三维模型在待标记图像中的标记位置。本发明实施例针对不同类别的模型和图像场景准确地产生标记,有利于更加准确和自然地显示模型初始化位置,产生的标记也更加符合三维模型和待标记图像的特点。
-
-
-
-
-
-
-
-
-