-
公开(公告)号:CN112926302A
公开(公告)日:2021-06-08
申请号:CN202110162943.4
申请日:2021-02-05
Applicant: 北京华宇信息技术有限公司
IPC: G06F40/205 , G06F40/279 , G06N3/04 , G06N3/08 , G10L15/26
Abstract: 本申请公开了一种语音识别文本的断句与标点预测方法及其装置、存储介质。其中所述方法,包括:获取语音解码输出的待处理文本;通过断句和符号预测模型处理所述待处理文本,生成预测结果;根据所述预测结果,生成带标点符号的最终文本。通过用语言模型对语音解码输出的待处理文本进行处理,实现了对语音识别文本的断句和标点符号预测。
-
-
公开(公告)号:CN112489646B
公开(公告)日:2024-04-02
申请号:CN202011295150.1
申请日:2020-11-18
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。
-
公开(公告)号:CN112953944A
公开(公告)日:2021-06-11
申请号:CN202110203497.7
申请日:2021-02-23
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种基于MapReduce的影音转码方法,解决现有技术中视频因格式问题导致网络上传消耗时间长的问题。所述方法包括以下步骤:在第一map作业包含的第一map任务中,将待处理的影音文件按照预设文件大小值切分,得到包含若干子文件的第一中间影音文件;对所述第一中间影音文件中的若干子文件进行排序,得到包含若干子文件排序后的第一影音文件;若干子文件排序后的第一影音文件通过若干转码服务器进行转码,得到包含若干子文件第二中间影音文件;在第一reduce作业包含的第一reduce任务中,若干子文件第二中间影音文件合并得到第二影音文件。
-
公开(公告)号:CN113205813B
公开(公告)日:2022-03-11
申请号:CN202110357882.7
申请日:2021-04-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。
-
公开(公告)号:CN113205813A
公开(公告)日:2021-08-03
申请号:CN202110357882.7
申请日:2021-04-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。
-
公开(公告)号:CN112712525A
公开(公告)日:2021-04-27
申请号:CN202011537099.0
申请日:2020-12-23
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种多方图像交互系统及方法,包括:采集模块,用于采集图像流;处理模块,用于对采集的图像流进行分割、调节、替换或合成中至少一项处理;交互模块,用于传输经处理模块处理后的图像。同时,针对用户对生成的视频图像流是否允许存储在视频会议系统中,分别给出了视频会议系统合成方案以及本地合成方案,满足了用户对个人隐私保护的要求。
-
-
公开(公告)号:CN110807747B
公开(公告)日:2021-03-30
申请号:CN201911049926.9
申请日:2019-10-31
Applicant: 北京华宇信息技术有限公司
Abstract: 本发明公开了一种基于前景蒙版的文档图像降噪方法,属于文档图像数据处理技术领域,该方法包括:通过随机采样统计最大频数确定图像背景颜色像素值;对比HSV空间像素值得到第一前景蒙版,针对图片亮度不均匀的情况,自适应局部二值化得到第二前景蒙版,第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版;然后,利用kmeans聚类方法得到像素板,获取代表性色彩,设定背景为之前计算得到的背景像素。本发明能有效提取文档图像的背景色并获取其前景蒙板,特别是针对前景主要是文本及图文表格的文档图像。利用前景蒙板的方法可以有效过滤去除包括背景上的无用干扰噪声而对前景主体不会造成很大损失,可以提高文档图像质量。
-
公开(公告)号:CN111127339B
公开(公告)日:2020-10-30
申请号:CN201911229389.6
申请日:2019-12-04
Applicant: 北京华宇信息技术有限公司
Abstract: 本发明提供一种文档图像的梯形畸变矫正方法及装置,通过对文档图像预处理后,对文档图像进行分类得到文本类、表格类或图形类,针对不同的类型分别采用不同的方法获取其文档内容的上下左右四个轮廓线,并通过轮廓线的四个交点完成透视变换,最后对透视变换后的文档图像的四个边附近的背景像素值进行扩充边缘的填充,消除透视变换后黑边填充的突兀效果。本发明针对不同文档类型图像,采用不同的内容轮廓线检测和边缘点检测方法,能有效检测到文档图像的内容轮廓和边界点,提高透视变换的效果,可以更好的提高文档图像的畸变矫正效果。
-
-
-
-
-
-
-
-
-