-
公开(公告)号:CN115951787A
公开(公告)日:2023-04-11
申请号:CN202310247029.9
申请日:2023-03-15
Applicant: 北京亮亮视野科技有限公司
IPC: G06F3/01 , G06F40/30 , G06F18/214
Abstract: 本发明提供近眼显示设备的交互方法、存储介质及近眼显示设备,涉及人机数据交互技术领域,包括:响应于用户指令,将第一感知数据整理为第一语义信息,将第二感知数据整理为第二语义信息;将第一语义信息和第二语义信息按照预设规则整理为语义文本;将语义文本输入至第一预训练模型,得到第一分析结果和第一反馈信息;将第一分析结果输入至第二预训练模型,得到第二反馈信息。本发明实现了对不同模态感知数据的整合处理,将不同的感知数据分别处理为语义信息后再按照预设规则整理为语义文本;并且,通过多个预训练模型对语义文本进行训练,使得近眼显示设备上能够呈现多样化的交互反馈信息,以满足用户不同的交互需求,提高用户体验。
-
公开(公告)号:CN113963355B
公开(公告)日:2022-03-25
申请号:CN202111575873.1
申请日:2021-12-22
Applicant: 北京亮亮视野科技有限公司
IPC: G06V30/148 , G06V30/10 , G06V40/20
Abstract: 本发明提供一种OCR文字识别方法、装置、电子设备及存储介质,其中,OCR文字识别方法包括接收对手势识别的开启操作;响应于所述开启操作,对场景中的手势进行检测,得到目标手势;基于所述目标手势,确定文字所在的图像区域;对所述图像区域中的文字进行识别,得到目标识别文字。采用本方法能够提高OCR文字识别效率。
-
公开(公告)号:CN115951787B
公开(公告)日:2023-07-25
申请号:CN202310247029.9
申请日:2023-03-15
Applicant: 北京亮亮视野科技有限公司
IPC: G06F3/01 , G06F40/30 , G06F18/214
Abstract: 本发明提供近眼显示设备的交互方法、存储介质及近眼显示设备,涉及人机数据交互技术领域,包括:响应于用户指令,将第一感知数据整理为第一语义信息,将第二感知数据整理为第二语义信息;将第一语义信息和第二语义信息按照预设规则整理为语义文本;将语义文本输入至第一预训练模型,得到第一分析结果和第一反馈信息;将第一分析结果输入至第二预训练模型,得到第二反馈信息。本发明实现了对不同模态感知数据的整合处理,将不同的感知数据分别处理为语义信息后再按照预设规则整理为语义文本;并且,通过多个预训练模型对语义文本进行训练,使得近眼显示设备上能够呈现多样化的交互反馈信息,以满足用户不同的交互需求,提高用户体验。
-
公开(公告)号:CN113840110B
公开(公告)日:2022-06-28
申请号:CN202111390318.1
申请日:2021-11-23
Applicant: 北京亮亮视野科技有限公司
Abstract: 本发明提供一种面向工作流程的视频处理方法、装置及存储介质,其中,面向工作流程的视频处理方法应用于记录工作流程的操作视频,包括:创建工作流程,其中,工作流程包括多个工作步骤;录制操作视频片段,其中,操作视频片段包括多个子操作视频片段;基于工作步骤的时间戳以及子操作视频片段的时间戳,将工作步骤与子操作视频片段相对应,得到关联有工作步骤的所述子操作视频片段;基于多个关联有所述工作步骤的子操作视频片段,得到关联有工作流程的操作视频片段。通过本发明,实现了操作视频片段与工作流程的有效关联,进而可以通过工作流程的步骤,定位到具体的操作视频片段,为用户快速理解工作流程打下基础。
-
公开(公告)号:CN115171727A
公开(公告)日:2022-10-11
申请号:CN202211092843.X
申请日:2022-09-08
Applicant: 北京亮亮视野科技有限公司
Abstract: 本发明提供一种量化沟通效率的方法及装置,其中,该方法包括:响应于接收到语音输入,通过骨传导技术判断语音输入是否为用户本人发出的语音,若语音输入不是用户本人发出的语音,则从下一次语音输入开始,记录语音重复的次数或者记录用户本人在接收到语音输入后做出反应的时长,以量化沟通效率。实现了对沟通效率的定量分析。
-
公开(公告)号:CN114359911A
公开(公告)日:2022-04-15
申请号:CN202210267289.8
申请日:2022-03-18
Applicant: 北京亮亮视野科技有限公司
Abstract: 本发明提供一种文字关键信息的提取方法及装置,方法包括:获取图像采集设备输入的当前场景图像,当前场景图像包括至少一个文字关联图像;识别文字关联图像所对应的文字信息;基于结构化区域模板,提取文字信息中的关键信息并输出;其中,结构化区域模板依据当前场景图像、基于语音指令确定的封闭图形轮廓位置、以及封闭图形轮廓内对应的关键字确定。通过识别得到一个开放场景下的场景图像中文字关联图像部分对应的文字信息,并结合在该场景下生成的结构化区域模板,提取得到文字新消息中的关键信息,从而不需要根据场景定制化开发,也可以得到特定场景下的图像中文字信息的关键信息对应的结构化信息,减少了人力开发的成本。
-
公开(公告)号:CN113936338A
公开(公告)日:2022-01-14
申请号:CN202111527828.9
申请日:2021-12-15
Applicant: 北京亮亮视野科技有限公司
IPC: G06V40/20 , G06V40/10 , G06V10/774
Abstract: 本发明提供一种手势识别方法、装置及电子设备,属于图像分析技术领域。手势识别方法应用于第一电子设备,包括:获取所述第一电子设备的摄像头采集的待识别图像;基于所述待识别图像,得到目标特征;将所述目标特征发送至第二电子设备,以供所述第二电子设备基于所述目标特征得到手势识别结果。手势识别方法应用于第二电子设备,包括:接收第一电子设备发送的目标特征,所述目标特征为所述第一电子设备基于待识别图像确定的;基于所述目标特征得到手势识别结果。本发明提供一种手势识别方法可以实现在多个电子设备间数据传输的稳定性和实时性,能够降低部分电子设备的能耗。
-
公开(公告)号:CN113840110A
公开(公告)日:2021-12-24
申请号:CN202111390318.1
申请日:2021-11-23
Applicant: 北京亮亮视野科技有限公司
Abstract: 本发明提供一种面向工作流程的视频处理方法、装置及存储介质,其中,面向工作流程的视频处理方法应用于记录工作流程的操作视频,包括:创建工作流程,其中,工作流程包括多个工作步骤;录制操作视频片段,其中,操作视频片段包括多个子操作视频片段;基于工作步骤的时间戳以及子操作视频片段的时间戳,将工作步骤与子操作视频片段相对应,得到关联有工作步骤的所述子操作视频片段;基于多个关联有所述工作步骤的子操作视频片段,得到关联有工作流程的操作视频片段。通过本发明,实现了操作视频片段与工作流程的有效关联,进而可以通过工作流程的步骤,定位到具体的操作视频片段,为用户快速理解工作流程打下基础。
-
公开(公告)号:CN113821685A
公开(公告)日:2021-12-21
申请号:CN202111390368.X
申请日:2021-11-23
Applicant: 北京亮亮视野科技有限公司
IPC: G06F16/78 , G06F16/787 , G16Y20/10 , G16Y20/40 , G16Y40/60
Abstract: 本发明提供一种面向物联网设备的数据处理方法、装置及存储介质,其中,面向物联网设备的数据处理方法包括:获取视频片段以及数据信息,其中,所述数据信息通过物联网设备进行采集;确定所述数据信息的第一时间戳,以及确定所述视频片段的第二时间戳;基于所述第一时间戳与所述第二时间戳相关联,根据所述数据信息与所述视频片段得到多模态数据信息。通过本发明提供的面向物联网设备的数据处理方法,可以为用户的多模态信息取用带来便捷。
-
公开(公告)号:CN116229469A
公开(公告)日:2023-06-06
申请号:CN202211505629.2
申请日:2022-11-28
Applicant: 北京亮亮视野科技有限公司
IPC: G06V30/14 , G06Q10/087
Abstract: 本发明提供一种基于AR技术的多目标拣货系统和拣货方法,基于AR技术的多目标检测拣货系统,包括:AR眼镜,用于将包含多个货物信息的视频流发送到智能分析系统,接收智能分析系统反馈的待拣货物的位置,并根据预设样式向用户提示待拣货物的位置;智能分析系统,用于接收AR眼镜发送的视频流,从视频流中识别出待拣货物的位置,并向AR眼镜反馈待拣货物的位置,可以实现同时识别多个目标货物信息,解决现有技术下单目标识别造成检测效率低下的问题,提高拣货效率,缩短拣货时间。
-
-
-
-
-
-
-
-
-