-
公开(公告)号:CN108694937A
公开(公告)日:2018-10-23
申请号:CN201710216097.3
申请日:2017-04-05
Applicant: 陈荣伟
Inventor: 陈荣伟
Abstract: 一种数字视音频监控系统中音频可视化监控的方法。方法包括:对实时解码后的每帧音频数据提取音频短时能量,归一化处后顺序存储到循环音频短时能量队列中;对每帧音频数据提取短时过门限率;根据音频短时过门限率和短时能量判断声音起点和终点,从声音起点开始提取音频特征向量并进行存储,当检测到声音终点后结束存储;根据所存储的若干音频特征向量提取声纹模型,将声纹模型与已存储的多个样本声纹模型进行比对和分类;对声音短时能量队列中各帧的能量值、各帧与最新帧的距离分别进行换算,在视频图像上从右至左连线各坐标点,画出一段时间内的音频波形曲线,并将音频分类名称叠加在相应曲线段的上方,实现音频监控的可视化。
-
公开(公告)号:CN107066084A
公开(公告)日:2017-08-18
申请号:CN201710006940.5
申请日:2017-01-05
Applicant: 摩托罗拉移动有限责任公司
Inventor: 阿米特·库马尔·阿格拉沃尔 , 萨恰巴拉塔·劳特
IPC: G06F3/01 , G06F3/16 , G06F3/0481 , H04M1/725
CPC classification number: G10L13/04 , G06K9/00335 , G06K9/00597 , G07C9/00158 , G10L13/00 , G10L21/10 , G06F3/011 , G06F3/0481 , G06F3/167 , H04M1/72569
Abstract: 为了管理音频读出和可视通知,公开了一种方法和设备。所述设备包括音频输出装置、显示装置、处理器、和存储代码的存储器,所述代码可由所述处理器执行以:经由所述音频输出装置将音频读出呈现给所述设备的所述用户,确定用户关注状态,以及响应于所述用户关注状态是用户感兴趣的状态,经由所述显示装置在与所述音频读出对应的可视通知中呈现可视提示。所述可视提示可以指示在所述可视通知中与所述音频读出的当前位置对应的位置。将所述用户关注状态确定为用户感兴趣的状态可以包括:接收传感器数据;以及基于所述传感器数据来确定用户是否正拿着所述设备。
-
-
公开(公告)号:CN106558309A
公开(公告)日:2017-04-05
申请号:CN201510629197.X
申请日:2015-09-28
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
CPC classification number: G10L15/20 , G10L15/063 , G10L15/16 , G10L15/26 , G10L21/10
Abstract: 本发明提供了一种口语对话策略生成方法,所述方法包括:步骤S1)使用人替代机器方式收集真实的人机对话数据样本;步骤S2)基于Agenda模拟用户模型,根据对话数据样本构建一个虚拟用户,用于模拟真实用户行为;步骤S3)为虚拟用户的语义信息添加噪声,构建噪声信道;步骤S4)根据虚拟用户的语义信息构建对话策略模板;步骤S5)提取对话策略模板中所有条件语句包含的自由参数构成参数向量,输入遗传算法中进行优化得到最优解;步骤S6)将最优解赋予对话策略模板得到对话策略。本发明的口语策略生成方法与现有的纯手工制定的对话策略相比具有更好的噪声鲁棒性;而且本发明定义的口语策略语言易于人工编辑和维护,更适合对系统行为有严格要求的商业环境。
-
公开(公告)号:CN103680492B
公开(公告)日:2017-03-01
申请号:CN201310453278.X
申请日:2013-09-24
Applicant: LG电子株式会社
CPC classification number: G10L13/086 , G10L13/00 , G10L21/10 , H04M1/72522 , H04M1/72544 , H04M1/72552
Abstract: 公开一种移动终端及其控制方法,通过其在通过句子单元输出与自然语言相对应的声音的过程中输出匹配自然语言的意义的反馈。本发明包括:显示单元,该显示单元被配置成通过句子单元显示文本;音频输出模块,该音频输出模块被配置成输出从将文本转换成声音而产生的合成声音;以及控制器,该控制器被配置成生成合成声音,提取文本的意义,并且控制匹配文本的意义的反馈以在经由音频输出模块输出合成声音时被输出。
-
公开(公告)号:CN106205632A
公开(公告)日:2016-12-07
申请号:CN201610571390.7
申请日:2016-07-18
Applicant: 广州视睿电子科技有限公司 , 广州视源电子科技股份有限公司
Inventor: 李纯冬
Abstract: 本发明涉及一种语音转化手写笔迹的方法和装置,语音转化手写笔迹的方法,包括以下步骤:在接收到用户输入的语音数据时,对语音数据进行语音识别处理,得到语音数据对应的语音内码;在笔迹数据库中对语音内码进行检索,在检索到与语音内码对应的笔迹内码时,从笔迹数据库中获取笔迹内码对应的手写笔迹的关键数据;关键数据包括手写笔迹的以下数据中的任意一种或任意组合:轨迹数据、截图数据和矢量图形数据;对关键数据进行笔迹还原处理,得到手写还原笔迹。本发明使得用户在可书写设备上进行书写时,可以通过语音输入,将语音数据转化成书写笔迹进行补充,过程简单,使用方便。
-
公开(公告)号:CN105529035A
公开(公告)日:2016-04-27
申请号:CN201510916425.1
申请日:2015-12-10
Applicant: 安徽海聚信息科技有限责任公司
CPC classification number: G10L21/10 , A61B5/01 , G10L15/02 , G10L15/26 , G10L2021/065
Abstract: 本发明公开了一种用于智能穿戴设备的系统,包括采集单元、分析单元、控制单元、提醒单元。采集单元、分析单元、提醒单元均与控制单元连接,并通过无线信号进行通信。采集单元与分析单元之间通过滤波模块和模数转换模块连接。采集单元所采集的信息送至滤波模块进行滤波处理,经过滤波处理后的数据被送入模数转换模块,将连续的模拟信号转换为数字信号后送至分析单元进行分析处理。本发明与现有技术相比,具有结构合理、操作简便,能够完成对外部语音信号的拾取,并实现语音、文字互相转换,进而有效解决听力残缺人士日常交际障碍等显著的优点,方便了听力残疾人士的日常生活,还照顾到他们的体温健康,便于大范围推广使用。
-
公开(公告)号:CN105282621A
公开(公告)日:2016-01-27
申请号:CN201410351478.9
申请日:2014-07-22
Applicant: 中兴通讯股份有限公司
IPC: H04N21/4788
CPC classification number: G10L21/10 , G06K9/00281 , G06K9/00315 , G06T13/40 , G10L15/22 , G10L15/25 , G10L25/63 , G11B27/031
Abstract: 本发明公开了一种语音消息可视化服务的实现方法及装置,涉及通讯领域。本发明公开的装置,至少包括:信息接收模块,接收消息发送方发送的或者本地存储的原始消息以及人像图片,其中,所述原始消息为文本消息或语音消息;动态视频生成模块,从所述人像图片中提取面部特征,生成面部表情,并将所述面部表情与所述原始消息合成为动态视频信息,其中,生成的面部表情与原始消息内容相对应;将所述动态视频信息在消息接收方的终端显示或发送给消息接收方。本发明还公开了一种语音消息可视化的实现方法。本申请技术方案较大限度地利用了资源,使用户更方便更有趣的发送信息,提高市场的竞争力,有明显的经济效益和社会效益。
-
公开(公告)号:CN104520923A
公开(公告)日:2015-04-15
申请号:CN201380041604.4
申请日:2013-07-23
Applicant: 卡西欧计算机株式会社
IPC: G10L13/033 , G06K9/00
CPC classification number: G10L21/10 , G06K9/00268 , G06K9/00288 , G06K9/00771 , G10L13/033 , G10L13/0335 , G10L13/043 , G10L2021/105 , G11B27/036 , H04N5/9305
Abstract: 本发明的目的在于提供用于使得文本语音和图像自由结合并且用于向观众同步再现语音和图像的内容再现控制设备、内容再现控制方法及其程序。内容再现控制设备(100)包括用于输入要被再现为语音声音的文本内容的文本输入模块(107),用于输入主体的图像的图像输入模块(102),使得所述主体的图像对所述文本内容进行语音化,用于将所述文本内容转换为语音数据的转换模块(109),用于生成视频数据的生成模块(109),在所述视频数据中,包括主体的嘴部在内的与语音化相关的对应部分已经被改变,以及使得对语音数据和生成的视频数据的同步再现的再现控制模块(109)。
-
公开(公告)号:CN104049885A
公开(公告)日:2014-09-17
申请号:CN201310392472.1
申请日:2013-09-02
Applicant: LG电子株式会社
IPC: G06F3/0488 , G06F3/0482 , G06F3/0486 , H04M1/725
CPC classification number: G10L15/26 , G06F3/04847 , G06F3/0488 , G06F3/04883 , G06F2203/04808 , G10L15/22 , G10L15/30 , G10L21/10 , H04M1/7255
Abstract: 本发明提供了一种移动终端和控制移动终端的方法。移动终端包括被构造为与至少一个其它终端进行无线通信的无线通信单元;被构造为存储记录的语音数据的存储器;被构造为显示表示所记录的语音数据的再现进度的图形对象的显示单元;以及控制器,其被构造为:接收指示图形对象的一部分已经被选择的选择信号,选择所记录的语音数据的包括图形对象被选择的时间点的部分,将所记录的语音数据的所选择的部分中包括的关键字语音数据转换为关键字文本数据,并且将关键字文本数据显示在显示单元上。
-
-
-
-
-
-
-
-
-