-
公开(公告)号:CN105340003A
公开(公告)日:2016-02-17
申请号:CN201380077502.8
申请日:2013-06-20
Applicant: 株式会社东芝
Abstract: 根据实施例的语音合成字典创建装置包括第一语音输入单元、第二语音输入单元、确定单元以及创建单元。第一语音输入单元接收第一语音数据的输入。第二语音输入单元接收被认为是适当的语音数据的第二语音数据的输入。确定单元确定第一语音数据的说话人是否与第二语音数据的说话人相同。当确定单元确定第一语音数据的说话人与第二语音数据的说话人相同时,创建单元使用第一语音数据以及与第一语音数据对应的文本来创建语音合成字典。
-
公开(公告)号:CN105283916A
公开(公告)日:2016-01-27
申请号:CN201380077322.X
申请日:2013-06-11
Applicant: 株式会社东芝
IPC: G10L19/018
CPC classification number: G10L19/018 , G10L13/06 , G10L13/08 , G10L13/10
Abstract: 本发明的电子水印嵌入装置具备:合成声音生成部,其按照所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述合成声音中的电子水印的嵌入时刻;以及嵌入部,其对上述合成声音,在由上述合成声音的上述嵌入时刻指定的时刻的特定的频带嵌入电子水印。
-
公开(公告)号:CN104835493A
公开(公告)日:2015-08-12
申请号:CN201510058451.5
申请日:2015-02-04
Applicant: 株式会社东芝
Inventor: 森田真弘
CPC classification number: G10L13/033
Abstract: 根据一个实施例,语音合成字典生成装置包括分析器、说话人自适应器、水平指定单元和确定单元。分析器被配置为分析语音数据,并生成包含对象说话人的话语特征的语音数据库。说话人自适应器被配置为通过基于数据库而将基本模型转换成更接近对象说话人的特征的说话人自适应来生成对象说话人的模型。水平指定单元被配置为接受表示说话人的话语技巧和/或说话人在语音合成字典的语言方面的母语水平的目标说话人水平的指定。确定单元被配置为根据目标说话人水平与对象说话人的说话人水平之间的关系,确定与在说话人自适应中的说话人特性再现的保真度有关的参数。
-
公开(公告)号:CN108417199B
公开(公告)日:2022-11-22
申请号:CN201810409237.3
申请日:2013-01-18
Applicant: 株式会社东芝
IPC: G10L13/02 , G10L19/018
Abstract: 本发明提供能够在不会使合成声音的音质劣化的情况下插入音频水印的音频水印信息检测装置及音频水印信息检测方法。实施方式的音频水印信息检测装置,具备:音高标记推定部,其推定嵌入了音频水印信息的合成声音的音高标记,并按每个所推定的音高标记截取声音;相位提取部,其提取上述音高标记推定部所截取的声音的相位;代表相位计算部,其根据上述相位提取部所提取的相位计算成为多个频点的代表的代表相位;以及判定部,其基于上述代表相位,判定上述音频水印信息的有无。
-
公开(公告)号:CN105122351A
公开(公告)日:2015-12-02
申请号:CN201380070775.X
申请日:2013-01-18
Applicant: 株式会社东芝
IPC: G10L13/02 , G10L19/018
CPC classification number: G10L19/018 , G10L13/02 , G10L13/033 , G10L19/012
Abstract: 本发明提供能够在不会使合成声音的音质劣化的情况下插入电子水印的声音合成装置、电子水印信息检测装置、声音合成方法、电子水印信息检测方法、声音合成程序及电子水印信息检测程序。实施方式的信息处理装置具备声源生成部、相位调制部、声道过滤部。声源生成部使用声音的基本频率序列及脉冲信号,生成声源信号。相位调制部对声源生成部所生成的声源信号,基于电子水印信息,按每个音高标记调制脉冲信号的相位。声道过滤部对相位调制部调制了脉冲信号的相位后的声源信号,使用频谱参数序列生成声音信号。
-
公开(公告)号:CN104464718A
公开(公告)日:2015-03-25
申请号:CN201410458186.5
申请日:2014-09-10
Applicant: 株式会社东芝
IPC: G10L13/08
CPC classification number: G10L13/033 , G10L13/10
Abstract: 根据一个实施例,一种韵律编辑装置包括近似轨迹生成器、设置器、显示控制器、操作接收器和更新器。所述近似轨迹生成器用包括控制点的参数曲线近似表示韵律信息的时间序列的轨迹,以生成近似轨迹。所述设置器在所述近似轨迹上设置与所述控制点对应的操作点。所述显示控制器在显示装置上显示操作屏幕,所述操作屏幕包括在其上显示所述操作点的所述近似轨迹。所述操作接收器接收在所述操作屏幕上移动任意选择的操作点的操作。所述更新器根据所述操作点的移动量计算所述控制点的位置,并更新所述近似轨迹。
-
公开(公告)号:CN104169912A
公开(公告)日:2014-11-26
申请号:CN201380005184.4
申请日:2013-03-12
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/241 , G06F17/30675
Abstract: 根据一个实施例,信息处理终端包括生成器、获取单元、和输出单元。生成器分析电子文档以生成包括该电子文档中的文本信息和关于该电子文档的结构信息的元数据项。获取单元将该元数据项传送至信息管理设备,使得信息管理设备估算类似于该元数据项的相似元数据项并获取对应于该相似元数据项的注解信息项。输出单元输出与电子文档相关的注解信息项。
-
公开(公告)号:CN103020105A
公开(公告)日:2013-04-03
申请号:CN201210365742.5
申请日:2012-09-27
Applicant: 株式会社东芝
CPC classification number: G10L13/027 , G09B5/062 , G09B21/006 , G10L13/08
Abstract: 本发明涉及文档读出支持设备和方法。根据一个实施例,提供了一种文档读出支持设备,具有第一到第三获取单元(11、12、14)、提取单元(13、确定单元(16)和用户验证单元(17)。第一获取单元(11)获取具有文本的文档。第二获取单元(12)获取具有定义的元数据,每个定义包括适用条件和读出方式。提取单元(13)提取文档的特征。第三获取单元(14)获取执行环境信息。确定单元(16)基于该特征和信息确定读出的参数候选项。用户验证单元(17)展示候选项并接收验证指令。
-
公开(公告)号:CN113724685B
公开(公告)日:2024-04-02
申请号:CN202111029334.8
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L13/033 , G10L13/10 , G10L15/14
Abstract: 本发明的实施方式涉及语音合成模型学习装置、语音合成模型学习方法以及存储介质,能够防止语音劣化和不自然的音素持续长度。实施方式的语音合成模型学习装置,具有:语音语料库存储部,其存储语音数据和所述语音数据的基音标记信息及上下文信息;分析部,其根据所述语音数据,分析基音标记信息的各基音标记时刻的音响特征参数;以及统计模型学习部,其根据所述分析部分析出的音响特征参数,学习包含音响特征参数的输出分布以及基于时刻参数的持续时间长度分布的具有多个状态的统计模型,所述音响特征参数包含基音特征参数。
-
公开(公告)号:CN107924686B
公开(公告)日:2022-07-26
申请号:CN201580082452.1
申请日:2015-09-16
Applicant: 株式会社东芝
Abstract: 不仅能够使波形的再现性提高而且能够高速地生成波形。实施方式的语音处理装置具有频谱参数算出部、相位谱算出部、群延迟谱算出部、频带群延迟参数算出部以及频带群延迟修正参数算出部。频谱参数算出部算出频谱参数。相位谱算出部算出第1相位谱。群延迟谱算出部基于第1相位谱的频率成分,根据第1相位谱算出群延迟谱。频带群延迟参数算出部根据群延迟谱算出预定频率范围中的频带群延迟参数。频带群延迟修正参数算出部算出对根据频带群延迟参数重新构建所得到的第2相位谱与第1相位谱之差进行修正的频带群延迟修正参数。
-
-
-
-
-
-
-
-
-