-
公开(公告)号:CN117037791A
公开(公告)日:2023-11-10
申请号:CN202211565299.6
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提供了一种基于语音识别的数据处理方法、装置、设备和存储介质,所述方法通过获取目标语音,通过语音转写模型对目标语音进行转写,生成文字文本,对文字文本的语篇结构及谈论对象进行抽取,通过错误检出模型对文字文本进行检测,根据抽取结果及检测结果,判断文字文本是否存在错误数据,提高文字文本中错误数据识别的准确率,从而提高语音识别准确率。
-
公开(公告)号:CN102946499B
公开(公告)日:2015-10-14
申请号:CN201210461116.6
申请日:2012-11-14
Applicant: 广州市讯飞樽鸿信息技术有限公司
IPC: H04M3/533
Abstract: 本发明公开了一种可视化语音信箱系统,包括IVR子系统和语音云子系统,所述IVR子系统用于接收主叫终端传送的数据,所述数据包括录制语音和被叫终端信息,所述语音云子系统用于将录制语音通过智能语音识别技术转换成文字文本,并将录制语音作为留言语音,所述IVR子系统还用于根据被叫终端信息分析得到被叫终端,将所述留言语音和转换后的文字文本作为留言信息一并主动发送至被叫终端。本发明还提供了一应用于可视化语音信箱系统的方法。通过本发明的可视化语音信箱系统及应用于可视化语音信箱系统的方法,能够向被叫用户主动推送留言语音及对应的文字文本,提高用户的使用体验。
-
公开(公告)号:CN105721722A
公开(公告)日:2016-06-29
申请号:CN201610048750.5
申请日:2016-01-23
Applicant: 广州市讯飞樽鸿信息技术有限公司
CPC classification number: H04M3/42017 , H04M3/58
Abstract: 本发明提供一种呼转平台的个性化提示媒体系统及其实现方法,所述方法包括个性化媒体内容的创作和入库、个性化媒体内容展示、个性化媒体内容订购支付、个性化提示媒体内容应用,针对用户对提示媒体的需求,通过对提示媒体内容的制作入库、展示、推荐、购买订购、使用等全流程的系统构建,向用户提供基于呼转平台的完整的个性化提示媒体应用体验,提示媒体格式丰富、来源多样、扩展性强、有个性化。本发明提供的呼转平台的个性化提示媒体系统通过上述方法实现用户便捷购买订购、使用、设置提示媒体,强化用户在呼转平台中的个性属性,改善呼转平台使用体验。
-
公开(公告)号:CN105721722B
公开(公告)日:2018-07-06
申请号:CN201610048750.5
申请日:2016-01-23
Applicant: 广州市讯飞樽鸿信息技术有限公司
Abstract: 本发明提供一种呼转平台的个性化提示媒体系统及其实现方法,所述方法包括个性化媒体内容的创作和入库、个性化媒体内容展示、个性化媒体内容订购支付、个性化提示媒体内容应用,针对用户对提示媒体的需求,通过对提示媒体内容的制作入库、展示、推荐、购买订购、使用等全流程的系统构建,向用户提供基于呼转平台的完整的个性化提示媒体应用体验,提示媒体格式丰富、来源多样、扩展性强、有个性化。本发明提供的呼转平台的个性化提示媒体系统通过上述方法实现用户便捷购买订购、使用、设置提示媒体,强化用户在呼转平台中的个性属性,改善呼转平台使用体验。
-
公开(公告)号:CN116071822A
公开(公告)日:2023-05-05
申请号:CN202310004312.9
申请日:2023-01-03
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
IPC: G06V40/20 , G06F40/289 , G06V20/40 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本申请公开了一种手语识别方法及相关装置、设备、存储介质,手语识别方法包括:获取分句视频帧序列,分句视频帧序列是对手语动作序列进行采集得到,分句视频帧序列中的手语动作所表达内容为一个分句;对分句视频帧序列按照分词进行划分,得到若干分词视频帧序列,分句视频帧序列中的手语动作所表达内容为一个分词;对各分词视频帧序列进行动作识别,得到各分词视频帧序列对应的分词;利用各分词视频帧序列对应的分词,得到分句视频帧序列对应的分句。上述方案,能够提高视频通话沟通效率。
-
公开(公告)号:CN115936024A
公开(公告)日:2023-04-07
申请号:CN202211738470.9
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
IPC: G06F40/58 , G06F40/284
Abstract: 本发明提供一种语音翻译方法、装置、电子设备和存储介质,其中方法包括:获取待翻译的用户语音;基于用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。本发明提供的方法、装置、电子设备和存储介质,通过在获取到待翻译的用户语音之后,基于用户语音中各语种的分词数量确定语种翻译方向以实现语音翻译,在解决多语种混讲场景下的语种适应问题,减轻用户操作负担,提高语音翻译的灵活性的同时,大大降低了语音翻译的时延,提高了语音翻译的响应速度。
-
公开(公告)号:CN116597047A
公开(公告)日:2023-08-15
申请号:CN202310200510.2
申请日:2023-02-28
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
IPC: G06T11/60 , G06T11/00 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种图片生成方法、装置、设备及可读存储介质。本方案中,首先,获取用户的图片生成请求,图片生成请求中包括用户的至少一个个性化信息;再基于用户的至少一个个性化信息,生成包括与用户的至少一个个性化信息对应的领域元素信息的文本描述信息;最后,基于文本描述信息生成融合有领域元素信息个性化图片,并将个性化图片提供给用户。在本方案中,用户只需输入一些个性化信息,就可以为用户生成包含专业的领域元素信息的文本描述,并生成融合有专业的领域元素信息的个性化图片,该图片生成技术对于专业性较差的用户同样适用,降低了对用户专业性的依赖。
-
公开(公告)号:CN102946499A
公开(公告)日:2013-02-27
申请号:CN201210461116.6
申请日:2012-11-14
Applicant: 广州市讯飞樽鸿信息技术有限公司
IPC: H04M3/533
Abstract: 本发明公开了一种可视化语音信箱系统,包括IVR子系统和语音云子系统,所述IVR子系统用于接收主叫终端传送的数据,所述数据包括录制语音和被叫终端信息,所述语音云子系统用于将录制语音通过智能语音识别技术转换成文字文本,并将录制语音作为留言语音,所述IVR子系统还用于根据被叫终端信息分析得到被叫终端,将所述留言语音和转换后的文字文本作为留言信息一并主动发送至被叫终端。本发明还提供了一应用于可视化语音信箱系统的方法。通过本发明的可视化语音信箱系统及应用于可视化语音信箱系统的方法,能够向被叫用户主动推送留言语音及对应的文字文本,提高用户的使用体验。
-
-
-
-
-
-
-