-
公开(公告)号:CN115209186B
公开(公告)日:2025-03-14
申请号:CN202210683302.8
申请日:2015-09-28
Applicant: 索尼公司
IPC: H04N21/236 , H04N21/435 , H04N21/4545 , H04N21/4728 , H04N21/84 , H04N19/70
Abstract: 本发明的技术涉及一种再现装置和再现方法。该再现装置包括:解码单元,所述解码单元对经编码的视频数据或者经编码的音频数据进行解码;缩放区域选择单元,所述缩放区域选择单元从指定待缩放的区域的多条缩放区域信息中选择一条或多条缩放区域信息;以及数据处理单元,所述数据处理单元基于所选择的缩放区域信息对通过解码而获得的视频数据执行裁剪处理,或者对通过解码而获得的音频数据执行音频转换处理,其中,所述缩放区域信息包括指示缩放区域信息的数目或条数的缩放区域数目信息。
-
公开(公告)号:CN105684085A
公开(公告)日:2016-06-15
申请号:CN201480056387.0
申请日:2014-10-10
Applicant: 索尼公司
IPC: G11B27/10 , H04N5/04 , H04N5/60 , H04N21/236 , H04N21/41 , H04N21/434 , H04N21/439 , H04N21/8547
Abstract: 一种信息处理设备,用于以与由不同于该信息处理设备的第二信息处理设备进行的第一内容的再现同步的方式来再现第二内容,第一内容包括音频内容。该信息处理设备包括电路,该电路被配置成:从音频内容中提取第一特征;获得音频内容的第二特征,第二特征与第二内容一起;比较第一特征与第二特征;以及基于比较的结果生成用于以与第一内容同步的方式再现第二内容的同步信息。
-
公开(公告)号:CN102637435A
公开(公告)日:2012-08-15
申请号:CN201210027300.X
申请日:2012-02-02
Applicant: 索尼公司
IPC: G10L21/00
CPC classification number: G10L21/0308
Abstract: 本发明涉及音频信号处理设备、音频信号处理方法和程序。音频信号处理设备包括:时间频率分析单元,对输入音频信号执行时间频率分析;基底分解单元,输入学习数据并通过应用总基底频率来对从所述时间频率分析单元输入的对所述输入音频信号的时间频率分析结果执行基底分解以生成针对所述输入音频信号的基底活动,所述学习数据是基于包括来自多个声音源的声音的学习用音频信号来预先生成的并且由与各个声音源相对应的基底频率组成,所述总基底频率组合有与各个声音源相对应的基底频率;以及命令识别单元,输入来自基底分解单元的基底活动,以通过对所输入的基底活动执行识别处理来执行命令识别。
-
公开(公告)号:CN1185620C
公开(公告)日:2005-01-19
申请号:CN00118824.0
申请日:2000-04-22
Applicant: 索尼公司
CPC classification number: G10L19/012 , G10L21/038
Abstract: 在声音合成器中,噪音添加器产生具有300至4,600Hz的频带的噪音信号,调整该噪音信号的增益,和将该增益调整后的噪音信号添加到通过零填充器填充零后的激发源excW中,从而提供一个相当均匀的宽带激发源excW’。通过确定一个窄带激发源或一个填充零之后的宽带激发源的功率和使得增益适合于该窄带激发源或该功率来调整该信号增益。
-
-
公开(公告)号:CN1132146C
公开(公告)日:2003-12-24
申请号:CN96114441.6
申请日:1996-09-27
Applicant: 索尼公司
IPC: G10L13/02
CPC classification number: G10L19/093 , G10L19/10 , G10L25/27
Abstract: 一种使用正弦波形合成技术的语音合成方法和装置,防止当合成正弦波形时由于相位的移动导致的声音质量的下降。解码单元对来自编码侧的数据解码。被解码数据通过一个坏帧屏蔽单元被变换成话音/非话音数据。非话音帧检测电路根据该数据检测非话音帧。如存在两个或多个连续的非话音帧,话音声音合成单元将基波及其谐波的相位初始化成的一给定值。这使得在该话音的开始点对非话音和话音帧之间的相移初始化成为可能防止了诸如由于相移导致的合成的语音失真的声音质量的下降。
-
公开(公告)号:CN1106091C
公开(公告)日:2003-04-16
申请号:CN94120750.1
申请日:1994-12-26
Applicant: 索尼公司
IPC: H04B15/00
CPC classification number: G10L21/0208 , G10L21/0216 , G10L21/0232
Abstract: 减少输入语音信号所含噪声的方法和设备。利用A/D转换器将由送话器聚集的语音信号转换成数字输入信号。帧功率计算电路计算与数字输入信号的第一帧相关的平均帧功率。抑制比计算电路以予置阈值为基准根据平均帧功率的值计算噪声抑制比的不同值。电平鉴别电路根据噪声电平形成转换控制信号,将转换控制信号发送给抑制比计算电路,用以阈值的转换控制。抑制比值通过平滑电路发送给噪声减少电路,使其与输入信号相乘。
-
公开(公告)号:CN1083183C
公开(公告)日:2002-04-17
申请号:CN96105920.6
申请日:1996-02-17
Applicant: 索尼公司
CPC classification number: G10L21/0208 , G10L25/09 , G10L25/93
Abstract: 一种用来降低在一语音信号中的噪声的方法和装置能够抑制在该输入信号中的噪声并能简化其过程。该装置包括一用来将输入语音信号转换为一频域信号的快速付里叶变换单元3和一用于控制与为了消除来自输入语音信号中的噪声而使用的滤波相关的滤波特性的Hn值计算单元7。该装置还包括一通过与由Hn值计算单元7所产生的滤波特性相一致的滤波来降低该输入语音信号的频谱校正单元10。该Hn值计算单元7响应于由快速付里叶变换单元3所得到的输入信号频谱的以帧为基础的最大SN比而的一值和一估算噪声电平计算该Hn值并且响应于该Hn值控制在频谱校正单元10中的用来消除噪声的处理。
-
公开(公告)号:CN1197975A
公开(公告)日:1998-11-04
申请号:CN98109291.8
申请日:1998-03-28
Applicant: 索尼公司
CPC classification number: G06T9/008 , G06T9/004 , G10L19/0212 , H03M7/3082
Abstract: 本发明提供了包括以下部件的信号编码设备。归一化电路101执行线性预测等来提取输入信号的特征和执行加权。被加权的信号传送给T/F(时间轴/频率轴)变换电路102,信号在该电路中被进行诸如MDCT这样的变换来获得在频率轴上的系数y。该系数y提供给量化(标量量化(SQ)和矢量量化(VQ))电路103。位分配电路104利用系数y以及来自归一化电路101的诸如LPC系数这样的参数及音调来求出每一系数的量化位分配。置化(SQ和VQ)电路根据该分配位来控制对每一系数是执行SQ还是VQ。
-
公开(公告)号:CN1185616A
公开(公告)日:1998-06-24
申请号:CN97121233.3
申请日:1997-10-23
Applicant: 索尼公司
IPC: G10L9/18
CPC classification number: G10L21/038
Abstract: 准备窄频带代码簿和宽频带代码簿,在窄频带代码簿中已经先存储了从许多音频信号的模式中得到的窄频带音频信号的时域参数,在宽频带代码簿中对应于所述窄频带代码簿,已经先存储了从所述许多音频信号的模式中得到的宽频带音频信号的时域参数,并且通过宽频带代码簿进行合成。在这种情况下,采用自相关作为代码簿的参数。当音频合成时,采用把对LPC余量进行上取样得到的信号作为激励源。
-
-
-
-
-
-
-
-
-