-
公开(公告)号:CN108536655A
公开(公告)日:2018-09-14
申请号:CN201711414780.4
申请日:2017-12-21
Applicant: 广州市讯飞樽鸿信息技术有限公司
Abstract: 本发明提供一种基于手持智能终端的场景化朗读音频制作方法及系统。通过OCR识别、语音合成等新技术的应用,提出了基于手持智能终端的场景化朗读音频制作解决方案,提高信息内容的转换效率,降低信息与知识传播的成本,减少人们对获取信息与知识的代价,提升人们的用户体验。通过对OCR识别、语音合成等新技术的应用,对手持智能终端的展示内容进行采集并形成文字内容,通过对文字内容进行场景化识别,自动选择或手动设置背景音(如新闻播报的严谨、军事节目的激昂、故事文摘的轻快、校园的欢快等),设置音频朗读速度,利用播音员音库的声音音色与背景音交叉融合生成音频文件,并提供给使用者进行保存与分享。