虚拟声学空间中的音频回放调度

    公开(公告)号:CN107211062A

    公开(公告)日:2017-09-26

    申请号:CN201680008711.0

    申请日:2016-02-03

    Abstract: 一种用于处理音频数据的方法,该方法包括:接收对应于多个音频实例的音频数据,音频数据包括以下中的至少一个:(a)被分别记录的来自多个端点的音频数据,或(b)来自对应于多个讲话者的单个端点的并且包括多个讲话者中的每一个的空间信息的音频数据;在虚拟声学空间中渲染音频数据,使得每个音频实例在虚拟声学空间中具有各自不同的虚拟位置;并且将音频实例调度为在至少两个音频实例之间具有重叠的情况下回放,其中至少部分地根据感知激发规则的集合来执行调度。

    会议词语云
    43.
    发明公开

    公开(公告)号:CN107210036A

    公开(公告)日:2017-09-26

    申请号:CN201680008633.4

    申请日:2016-02-03

    Abstract: 各种公开的实现涉及对涉及多个会议参与者的会议的记录的处理和/或回放。本文公开的一些实现涉及接收对于会议记录的语音识别结果数据,该语音识别结果数据包括多个语音识别格以及语音识别格的多个假设词中的每一个的词语识别置信度分数。对于语音识别格中的假设词可以确定主词候选和替代词假设。可以计算术语频率度量,以用于对主词候选和替代词假设排序。可以根据替代假设列表来对假设词重新评分。

    时域滤波中的滤波器系数更新

    公开(公告)号:CN106549652A

    公开(公告)日:2017-03-29

    申请号:CN201510599861.0

    申请日:2015-09-18

    Inventor: 施栋 孙学京

    Abstract: 本文中公开的示例实施例涉及时域滤波中的滤波器系数更新。公开了一种处理音频信号的方法。该方法包括通过分析音频信号的第一部分来获得针对音频信号的第一部分的预定数目的目标增益。目标增益中的每个目标增益对应于音频信号的线性子带。该方法还包括通过迭代地执行以下操作来确定用于对音频信号的第一部分进行滤波的滤波器系数:从目标增益中选择至少一个目标增益,以及基于所选择的至少一个目标增益来更新滤波器系数。还公开了相应的处理音频信号的系统和计算机程序产品。

    分离的音频分析和处理
    46.
    发明公开

    公开(公告)号:CN106297813A

    公开(公告)日:2017-01-04

    申请号:CN201510283591.2

    申请日:2015-05-28

    Inventor: 施栋 孙学京

    Abstract: 本文中公开的示例实施例涉及分离的音频分析和处理。公开了一种用于处理音频信号的系统。该系统包括音频分析模块,被配置为分析输入音频信号以确定针对输入音频信号的处理参数,输入音频信号被表示在时域中。该系统还包括音频处理模块,被配置为与音频分析模块并行地处理输入音频信号。该音频处理模块包括时域滤波器,被配置为在时域中对输入音频信号进行滤波,以获得输出音频信号,以及滤波器控制器,被配置为基于由音频分析模块确定的处理参数来控制时域滤波器的滤波器系数。还公开了相应的处理音频信号的方法和计算机程序产品。

    用于信号传输控制的方法和系统

    公开(公告)号:CN103325386B

    公开(公告)日:2016-12-21

    申请号:CN201210080977.X

    申请日:2012-03-23

    CPC classification number: G10L25/84 G10L25/78 G10L2025/783

    Abstract: 描述了用于信号传输控制的方法和系统。接收或访问具有块或帧的时间序列的音频信号。特征被确定为合起来表征相对于当前时间最近已经处理的顺序音频块/帧。特征确定超过特异度标准,并且相对于最近处理的音频块/帧被延迟。在音频信号中检测语音活动指示。VAD基于一个判决并且涉及当前块/帧特征,该判决超过预设灵敏度阈值,并且在相对于块/帧时长的短时间段上计算而得。VAD和最近特征确定与状态相关信息进行组合,所述信息基于从多个特征中收集、在最近特征确定时间段之前的时间确定的先前特征确定的历史。基于所述组合输出有关开始或终止所述音频信号的判决,或相关的增益。

    调节视频会议系统中的空间一致性

    公开(公告)号:CN105635635A

    公开(公告)日:2016-06-01

    申请号:CN201410670297.2

    申请日:2014-11-19

    CPC classification number: H04N7/147 H04S7/30 H04S2420/01 H04S2420/11

    Abstract: 本发明的实施例涉及空间一致性调节。公开了一种用于调节视频会议中的空间一致性的方法。该方法包括将由视频端点设备采集的视觉场景展开为至少一个直线场景,该视频端点设备被配置成以全向方式采集视觉场景;检测至少一个直线场景与听觉场景之间的空间一致性,该听觉场景由相对于视频端点设备定位的音频端点设备所采集,该空间一致性为听觉场景与至少一个直线场景之间校准的程度;并且响应于所检测的空间一致性低于预定的阈值而调节空间一致性。还公开了相应的系统和计算机程序产品。

Patent Agency Ranking