-
公开(公告)号:CN104246531A
公开(公告)日:2014-12-24
申请号:CN201380019519.8
申请日:2013-04-10
Applicant: 高通股份有限公司
CPC classification number: G01S3/8006 , G01B21/00 , G01S3/80 , G01S3/8083 , G01S5/18 , G01S5/186 , G01S15/025 , G01S15/876 , G06F1/1633 , G06F3/0484 , G06F3/167 , G10L2021/02166 , H04R1/08 , H04R3/00 , H04R3/005 , G01S15/87
Abstract: 本发明描述一种用于在电子装置上显示用户接口的方法。所述方法包含呈现用户接口。所述用户接口包含坐标系。所述坐标系基于传感器数据而对应于物理坐标。所述方法还包含提供允许选择所述坐标系的至少一个扇区的扇区选择特征。所述方法进一步包含提供允许编辑所述至少一个扇区的扇区编辑特征。
-
公开(公告)号:CN118891674A
公开(公告)日:2024-11-01
申请号:CN202380026687.3
申请日:2023-03-16
Applicant: 高通股份有限公司
IPC: G10L21/0208 , G10L21/0272 , G10L25/30 , H04M3/56 , G06N3/02 , G06F3/16
Abstract: 一种设备包括被配置为接收输入音频信号的一个或多个处理器。该一个或多个处理器还被配置为基于多个声音源的组合表示处理该输入音频信号以生成输出音频信号。使用该组合表示以从该输入音频信号中选择性地保留或移除该多个声音源的声音。该一个或多个处理器被进一步配置为向第二设备提供该输出音频信号。
-
公开(公告)号:CN115335900A
公开(公告)日:2022-11-11
申请号:CN202180021458.3
申请日:2021-03-24
Applicant: 高通股份有限公司
IPC: G10L19/008 , H04S7/00 , H04S3/00 , G10L25/30 , G10L21/0216
Abstract: 一种设备包括存储器,其被配置为存储在不同时间段处的未经变换的全景声系数。该设备还包括一个或多个处理器,其被配置为:获得在不同时间段处的未经变换的全景声系数,其中,在不同时间段处的未经变换的全景声系数表示在不同时间段处的声场。一个或多个处理器还被配置为:基于约束来将一个自适应网络应用于在不同时间段处的未经变换的全景声系数,以生成在不同时间段处的经变换的全景声系数,其中,在不同时间段处的经变换的全景声系数表示基于约束而修改的、在不同时间段处的经修改的声场。
-
公开(公告)号:CN112074900A
公开(公告)日:2020-12-11
申请号:CN201980029699.5
申请日:2019-05-02
Applicant: 高通股份有限公司
Abstract: 一种设备包括被配置为存储与自然语言处理库的类别相关联的类别标记的存储器。处理器被配置为:分析输入音频数据以生成文本串并至少对所述文本串执行自然语言处理以生成输出文本串,所述输出文本串包括与第一设备、说话者、位置或其组合相关联的动作。所述处理器被配置为:将所述输入音频数据与所述类别的音频数据进行比较,以确定所述输入音频数据是否与所述类别中的任何一个类别相匹配;并且响应于确定所述输入音频数据不与所述类别中的任何一个类别相匹配:创建新类别标记;将所述新类别标记与所述输出文本串的至少一部分相关联;使用所述新类别标记来更新所述类别;以及生成指示所述新类别标记的通知。
-
公开(公告)号:CN110114829A
公开(公告)日:2019-08-09
申请号:CN201780079428.1
申请日:2017-11-28
Applicant: 高通股份有限公司
Abstract: 一种设备包含话语处理引擎,所述话语处理引擎经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是与参考特征相差至少阈值量。所述设备进一步包含响应于所述话语处理引擎的选择电路。所述选择电路经配置以基于所述第一特征与所述参考特征相差至少阈值量从多个话语码本之中选择特定话语码本。所述特定话语码本与所述第一特征相关联。此第一特征是基于所述用户的情绪、所述用户的环境和所述用户的估计的年龄或距离麦克风的所述用户的估计的距离的。
-
公开(公告)号:CN109416585A
公开(公告)日:2019-03-01
申请号:CN201780041372.0
申请日:2017-05-25
Applicant: 高通股份有限公司
Abstract: 本发明提供一种用于输出虚拟声音的方法,所述方法包含在一或多个麦克风处检测环境中的音频信号。所述方法还包含在处理器处确定所述音频信号的声源的位置,及基于所述音频信号而估计所述环境的一或多个声学特性。所述方法进一步包含基于所述一或多个声学特性而将虚拟声音插入到所述环境中。所述虚拟声音具有从所述声源的所述位置产生的声音的一或多个音频属性。
-
公开(公告)号:CN108702354A
公开(公告)日:2018-10-23
申请号:CN201680082231.9
申请日:2016-12-22
Applicant: 高通股份有限公司
CPC classification number: G06F21/32 , G06F21/316 , G06F21/36 , G06F2221/2133 , H04L63/0861 , H04W12/06
Abstract: 一种装置包含存储器和处理器。所述存储器经配置以存储阈值。所述处理器经配置以基于认证数据认证用户。所述处理器还经配置以响应于确定所述用户经认证而产生相关性分数,所述相关性分数指示从第一传感器接收的第一信号与从第二传感器接收的第二信号之间的相关性。所述处理器还经配置以基于所述相关性分数与所述阈值的比较来确定所述用户的活跃度。
-
公开(公告)号:CN104246531B
公开(公告)日:2017-11-14
申请号:CN201380019519.8
申请日:2013-04-10
Applicant: 高通股份有限公司
CPC classification number: G01S3/8006 , G01B21/00 , G01S3/80 , G01S3/8083 , G01S5/18 , G01S5/186 , G01S15/025 , G01S15/876 , G06F1/1633 , G06F3/0484 , G06F3/167 , G10L2021/02166 , H04R1/08 , H04R3/00 , H04R3/005
Abstract: 本发明描述一种用于在电子装置上显示用户接口的方法。所述方法包含呈现用户接口。所述用户接口包含坐标系。所述坐标系基于传感器数据而对应于物理坐标。所述方法还包含提供允许选择所述坐标系的至少一个扇区的扇区选择特征。所述方法进一步包含提供允许编辑所述至少一个扇区的扇区编辑特征。
-
公开(公告)号:CN120019379A
公开(公告)日:2025-05-16
申请号:CN202380072502.2
申请日:2023-09-19
Applicant: 高通股份有限公司
Abstract: 提供了用于自然语言处理的系统和技术。系统基于输入内容(例如,文本和/或语音)生成多个令牌(例如,词或其部分)。该系统搜索该多个令牌以基于概率生成该多个令牌的第一排序。该系统生成该多个令牌的自然语言推理(NLI)得分,以基于对该输入内容的忠实度(例如,这些令牌是否基于该输入内容产生为真的陈述)来生成该多个令牌的第二排序。该系统生成输出文本,该输出文本包括基于该第一排序和该第二排序从该多个令牌中选择的至少一个令牌。
-
公开(公告)号:CN117642815B
公开(公告)日:2025-03-25
申请号:CN202280048322.6
申请日:2022-06-23
Applicant: 高通股份有限公司
IPC: G10L21/0208 , G10L15/08 , G10L21/0216 , G06N3/045
Abstract: 一种设备包括被配置为存储指令的存储器和被配置为执行指令的一个或多个处理器。所述一个或多个处理器被配置为执行所述指令以:接收音频数据,所述音频数据包括与第一麦克风的第一输出相对应的第一音频帧和与第二麦克风的第二输出相对应的第二音频帧。所述一个或多个处理器进一步被配置为执行指令以将音频数据提供给第一噪声抑制网络和第二噪声抑制网络。第一噪声抑制网络被配置为生成第一经噪声抑制音频帧,并且第二噪声抑制网络被配置为生成第二经噪声抑制音频帧。所述一个或多个处理器进一步被配置为执行指令以将经噪声抑制音频帧提供给注意力池化网络。注意力池化网络被配置为生成输出经噪声抑制音频帧。
-
-
-
-
-
-
-
-
-