-
公开(公告)号:CN105118082A
公开(公告)日:2015-12-02
申请号:CN201510467723.7
申请日:2015-07-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开一种个性化视频生成方法及系统,该方法包括:获取包含人脸的用户图像;提取所述用户图像中的人脸图像;获取目标视频;将所述人脸图像替换掉所述目标视频中待匹配人物的人脸,并根据视频场景的变化动态调整替换后的人脸图像,得到个性化视频。利用本发明,可以提高个性化视频与用户的互动性和娱乐性,提升用户体验度。
-
公开(公告)号:CN106156110B
公开(公告)日:2019-07-30
申请号:CN201510159102.2
申请日:2015-04-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/903 , G06F17/22
Abstract: 本发明公开了一种文本语义理解方法及系统,该方法包括:预先构建基于主网‑子网模式的有向图文法网络,所述有向图文法网络包括一个主网络、以及一个或多个子网络,所述有向图文法网络的每段路径对应一个文本字符或一个子网络标识符;获取待解析文本;基于所述有向图文法网络对所述文本进行解码,得到解码路径;获取所述解码路径的相关语义作为语义理解结果。本发明可以有效地降低有向图文法网络的复杂度,提高解码效率,降低内存消耗。
-
公开(公告)号:CN105989853A
公开(公告)日:2016-10-05
申请号:CN201510091491.X
申请日:2015-02-28
Applicant: 科大讯飞股份有限公司
IPC: G10L25/60
Abstract: 本发明公开了一种音频质量评测方法及系统,属于语音信号处理技术领域。该音频质量评测方法包括:接收用户输入的音频数据;对所述音频数据进行转码处理,得到多个音频采样点数据;分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。该音频质量评测方法,综合多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要。
-
公开(公告)号:CN105280196A
公开(公告)日:2016-01-27
申请号:CN201510810644.1
申请日:2015-11-19
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种副歌检测方法及系统,该方法包括:接收待检测的音频数据;提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域能量包络的极值点的频率值及能量值;利用提取的检测特征进行副歌检测,得到检测结果。利用本发明,可以有效提高副歌检测的准确度。
-
公开(公告)号:CN105005777A
公开(公告)日:2015-10-28
申请号:CN201510467751.9
申请日:2015-07-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及信息处理领域,公开了一种基于人脸的音视频推荐方法及系统。该方法包括:接收用户发送的包含人脸的用户图像;确定所述用户图像中人脸的数量;如果人脸的数量为一个,则提取包含单个人脸的图像特征信息;如果人脸的数量为多个,则提取包含多个人脸的图像特征信息;根据提取的图像特征信息确定向所述用户推荐的音视频;将所述音视频推荐给所述用户。利用本发明可以更全面地分析图像,找到用户需求,给用户推荐合适的音视频,提升用户体验度。
-
公开(公告)号:CN106776517B
公开(公告)日:2020-07-14
申请号:CN201611184297.7
申请日:2016-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/186
Abstract: 本申请提出一种自动作诗方法和装置及系统,该方法包括:接收作诗主题词及作诗藏头字;根据所述作诗主题词及作诗藏头字,以及预先构建的自动作诗模型生成诗。该方法能够生成语义更连贯的诗句,提高用户体验。
-
公开(公告)号:CN106057208B
公开(公告)日:2019-11-15
申请号:CN201610425682.X
申请日:2016-06-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/013 , G11B20/10
Abstract: 本发明实施例提供了一种音频修正方法及装置,其中方法包括:获取第一音频数据;获取第一音高曲线,所述第一音高曲线为所述第一音频数据的音高曲线;根据第二音高曲线,对所述第一音高曲线依次进行音阶修正及调性修正,以得到修正后的第一音高曲线,其中所述第二音高曲线为与所述第一音频数据相对应的第二音频数据的音高曲线;将修正后的第一音高曲线转换回音频信号,以得到修正后的第一音频数据。以歌曲为例,本发明实施例可以使修正后的用户演唱歌曲音高曲线与原唱歌曲音高曲线的走势保持一致,并且用户演唱歌曲音高曲线的起伏相比修正前更接近原唱歌曲,从而大大提升了用户演唱歌曲的节奏感和听感,提升了对歌曲等音频数据的修正效果。
-
公开(公告)号:CN105280196B
公开(公告)日:2019-03-19
申请号:CN201510810644.1
申请日:2015-11-19
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种副歌检测方法及系统,该方法包括:接收待检测的音频数据;提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域能量包络的极值点的频率值及能量值;利用提取的检测特征进行副歌检测,得到检测结果。利用本发明,可以有效提高副歌检测的准确度。
-
公开(公告)号:CN106156110A
公开(公告)日:2016-11-23
申请号:CN201510159102.2
申请日:2015-04-03
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种文本语义理解方法及系统,该方法包括:预先构建基于主网-子网模式的有向图文法网络,所述有向图文法网络包括一个主网络、以及一个或多个子网络,所述有向图文法网络的每段路径对应一个文本字符或一个子网络标识符;获取待解析文本;基于所述有向图文法网络对所述文本进行解码,得到解码路径;获取所述解码路径的相关语义作为语义理解结果。本发明可以有效地降低有向图文法网络的复杂度,提高解码效率,降低内存消耗。
-
公开(公告)号:CN106057208A
公开(公告)日:2016-10-26
申请号:CN201610425682.X
申请日:2016-06-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/013 , G11B20/10
Abstract: 本发明实施例提供了一种音频修正方法及装置,其中方法包括:获取第一音频数据;获取第一音高曲线,所述第一音高曲线为所述第一音频数据的音高曲线;根据第二音高曲线,对所述第一音高曲线依次进行音阶修正及调性修正,以得到修正后的第一音高曲线,其中所述第二音高曲线为与所述第一音频数据相对应的第二音频数据的音高曲线;将修正后的第一音高曲线转换回音频信号,以得到修正后的第一音频数据。以歌曲为例,本发明实施例可以使修正后的用户演唱歌曲音高曲线与原唱歌曲音高曲线的走势保持一致,并且用户演唱歌曲音高曲线的起伏相比修正前更接近原唱歌曲,从而大大提升了用户演唱歌曲的节奏感和听感,提升了对歌曲等音频数据的修正效果。
-
-
-
-
-
-
-
-
-