-
公开(公告)号:CN114554012B
公开(公告)日:2023-09-12
申请号:CN202011294035.2
申请日:2020-11-18
Applicant: 华为技术有限公司
IPC: H04M1/72484
Abstract: 本申请实施例提供一种来电接听方法、电子设备及存储介质,涉及通信技术领域,该方法包括:当接收到来电后,检测可连接的第二电子设备;检测到一个或多个可连接的所述第二电子设备,在所述第一电子设备的显示界面中显示一个或多个所述第二电子设备的接听控件;检测用于选取接听设备的第一操作;响应于检测到的所述第一操作,在一个或多个所述第二电子设备中确定接听设备,向所述接听设备发送连接请求,与所述接听设备建立连接。本申请实施例提供的方法,能够使得无线耳机在多个电子设备之间进行无缝切换,提高用户的来电接听的体验。
-
公开(公告)号:CN114333896A
公开(公告)日:2022-04-12
申请号:CN202011027680.8
申请日:2020-09-25
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G10L21/0272 , G10L21/0308 , G10L25/03 , G10L25/30 , G06V40/16
Abstract: 本申请实施例提供了一种语音分离方法,涉及电子设备领域。通过获取用户在说话过程中包含用户语音的音频信息及包含用户脸部的视频信息,并对所述音频信息进行编码得到混合声学特征,再从所述视频信息中提取所述用户的视觉语义特征,再将所述混合声学特征和所述视觉语义特征输入至预设视觉语音分离网络,得到所述用户的声学特征,最后对所述用户的声学特征进行解码,得到所述用户的语音信号。本申请实施例还提供了一种电子设备、芯片及计算机可读存储介质。本申请基于视觉语义特征对混合语音进行语音分离,可以从环境噪声干扰中准确地分离出目标说话者的语音。
-
公开(公告)号:CN115691538A
公开(公告)日:2023-02-03
申请号:CN202110867215.3
申请日:2021-07-29
Applicant: 华为技术有限公司
IPC: G10L21/0272 , G10L25/57 , H04N21/439
Abstract: 本申请公开了视频处理方法及电子设备,涉及电子技术领域。该方法包括:首先,电子设备获取到视频后,从视频的图像帧中提取人物的视觉语义特征,并基于视觉语义特征从图像帧对应的音频信息中提取该人物的声音;其次,在提取到人物在视频中部分声音后,可以确定该人物的声纹等声学特征,并基于该声学特征确定该人物在视频中全部的声音。很显然的,本申请公开的视频处理方法及电子设备,在无需预先获取人物声纹的情况下,可以独立的从视频中分离一个或多个人物的声音,使得用户在视频通话、观看视频、编辑视频时,可以对分离出来的人物声音进行处理。
-
公开(公告)号:CN114554012A
公开(公告)日:2022-05-27
申请号:CN202011294035.2
申请日:2020-11-18
Applicant: 华为技术有限公司
IPC: H04M1/72484
Abstract: 本申请实施例提供一种来电接听方法、电子设备及存储介质,涉及通信技术领域,该方法包括:当接收到来电后,检测可连接的第二电子设备;检测到一个或多个可连接的所述第二电子设备,在所述第一电子设备的显示界面中显示一个或多个所述第二电子设备的接听控件;检测用于选取接听设备的第一操作;响应于检测到的所述第一操作,在一个或多个所述第二电子设备中确定接听设备,向所述接听设备发送连接请求,与所述接听设备建立连接。本申请实施例提供的方法,能够使得无线耳机在多个电子设备之间进行无缝切换,提高用户的来电接听的体验。
-
公开(公告)号:CN112069863A
公开(公告)日:2020-12-11
申请号:CN201910502644.3
申请日:2019-06-11
Applicant: 华为技术有限公司
Abstract: 一种面部特征的有效性判定方法及电子设备,用以解决基于机器学习的方法判定复杂度高的问题。通过第一视频图像的面部特征确定姿态信息和/或面部变化信息;其中,姿态信息用于表征所述第一视频图像中面部特征所指示的人物头部的偏转度,所述面部变化信息用于表征所述人物头部在所述第一视频图像与第二视频图像中的位置变化情况,所述第二视频图像为所述第一视频图像所属的视频流中所述第一视频图像的前一帧图像;然后根据所述姿态信息和/或所述面部变化信息,确定所述面部特征是否为无效特征,进而再确定是否对第一视频图像的人物面部进行三维重建处理,无需预先训练模型,复杂度较低,处理时间较短。
-
公开(公告)号:CN114064160A
公开(公告)日:2022-02-18
申请号:CN202010753568.6
申请日:2020-07-30
Applicant: 华为技术有限公司
IPC: G06F9/451
Abstract: 一种应用图标布局方法及相关装置。在该方法中,第一电子设备可通过蓝牙、Wi‑Fi、NFC中的一项或多项等技术向第二电子设备传输携带桌面布局信息及应用图标位置信息的第一信息。第一电子设备还可通过蜂窝移动通信技术或WAN技术向第二电子设备传输第一信息。第一电子设备可响应于用户操作,将携带桌面布局信息及应用图标位置信息的第一信息发送给第二电子设备。第二电子设备可接收该第一信息,并按照该第一信息指示的桌面布局和应用图标位置对所安装的应用图标在桌面上进行布局。这样,可以提高使用电子设备的便利性。
-
公开(公告)号:CN115050375A
公开(公告)日:2022-09-13
申请号:CN202110218188.7
申请日:2021-02-26
Applicant: 华为技术有限公司
IPC: G10L17/22 , G10L15/26 , G10L21/0272 , G06V40/20 , G06V40/16
Abstract: 一种设备的语音操作方法,包括:获取摄像头采集的视频;获取麦克风采集的语音信息;检测所述视频中的人脸图像;提取所述人脸图像的唇部特征及面部特征;根据所述唇部特征,确定时间区间;根据所述时间区间在所述语音信息中截取对应的音频片段;根据所述面部特征获取声纹信息;根据所述声纹信息对所述音频片段进行语音识别,获取语音信息。使用该方法进行设备的语音操作,无需预先确定目标用户和提前录制目标用户的声纹信息,在多用户同时使用设备时能够自主提取多个用户的声纹信息,逐一分离语音。同时能自主更新和注册声纹。使用该方法进行设备的语音操作可以显著提升设备在嘈杂或多用户说话场景时的语音识别效果。
-
公开(公告)号:CN113014846B
公开(公告)日:2022-07-22
申请号:CN201911315367.1
申请日:2019-12-19
Applicant: 华为技术有限公司
IPC: H04N7/14 , H04N21/4788 , G06V20/40
Abstract: 本发明涉及图像处理领域,公开了一种视频采集控制方法、电子设备、计算机可读存储介质、计算机程序产品及芯片,该电子设备包括:包括:显示器,键盘,摄像头和处理器;摄像头设置于键盘附近,用于在视频通信中,采集视频帧,并将采集的视频帧发送给处理器;处理器,与显示器、键盘、摄像头连接,用于接收来自摄像头的第一视频帧,确定第一视频帧中包含符合预设手指模型的内容,则去除第一视频帧中的手指,获得第二视频帧;并将第二视频帧发送给显示器显示,和/或,将第二视频帧发送给对端电子设备显示。以解决现有技术中视频通话过程中手指比例容易失真的技术问题。该方法可用于人工智能设备,该方法和深度学习等技术相关。
-
公开(公告)号:CN114333767A
公开(公告)日:2022-04-12
申请号:CN202011055886.1
申请日:2020-09-29
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
Abstract: 本申请提供一种发声者语音抽取方法、装置、存储介质及电子设备,用以提高语音识别的实时性,以便更好的适应实际应用场景。该方法包括:采集环境中的混合语音,所述混合语音包括目标发声者的语音;基于所述混合语音,获得第一语音时域特征信息;基于已有的所述目标发声者的声纹信息,从所述第一语音时域特征信息中实时抽取所述目标发声者的第二语音时域特征信息;基于所述第二语音时域特征信息,获得所述目标发声者的语音段。
-
公开(公告)号:CN113014846A
公开(公告)日:2021-06-22
申请号:CN201911315367.1
申请日:2019-12-19
Applicant: 华为技术有限公司
IPC: H04N7/14 , H04N21/4788 , G06K9/00
Abstract: 本发明涉及图像处理领域,公开了一种视频采集控制方法、电子设备、计算机可读存储介质、计算机程序产品及芯片,该电子设备包括:包括:显示器,键盘,摄像头和处理器;摄像头设置于键盘附近,用于在视频通信中,采集视频帧,并将采集的视频帧发送给处理器;处理器,与显示器、键盘、摄像头连接,用于接收来自摄像头的第一视频帧,确定第一视频帧中包含符合预设手指模型的内容,则去除第一视频帧中的手指,获得第二视频帧;并将第二视频帧发送给显示器显示,和/或,将第二视频帧发送给对端电子设备显示。以解决现有技术中视频通话过程中手指比例容易失真的技术问题。该方法可用于人工智能设备,该方法和深度学习等技术相关。
-
-
-
-
-
-
-
-
-