-
公开(公告)号:CN117880601A
公开(公告)日:2024-04-12
申请号:CN202410032933.2
申请日:2024-01-09
Applicant: 出门问问信息科技有限公司
IPC: H04N21/488 , H04N21/234 , H04N21/44 , H04N21/2368
Abstract: 本发明实施例公开了一种视频生成方法、装置、电子设备和存储介质。通过获取输入数据,所述输入数据包括字幕文件,将所述字幕文件拆分为多个子字幕,生成各所述子字幕对应的子视频,根据所述子视频获取目标视频。由此,可以实现字幕的并行合成,降低生成视频所用时间。
-
公开(公告)号:CN111047436B
公开(公告)日:2023-08-11
申请号:CN201911356937.1
申请日:2019-12-25
Applicant: 出门问问信息科技有限公司
IPC: G06Q40/03 , G06F16/332
Abstract: 本申请公开了一种信息判定方法、装置及存储介质,其中,所述方法包括:基于用户的题目领域类型,从多种候选的打分器中选取与所述题目领域类型匹配的打分器;其中,所述候选的打分器中包含有一个或多个校验策略;并且不同的候选的打分器中包含的校验策略至少部分不同;基于所述用户的信息,以及选取的所述打分器包含的一个或多个校验策略,对所述用户针对题目的回答进行判定,得到一个或多个校验策略所对应的一个或多个子判定结果;对所述一个或多个子判定结果进行融合,得到所述判定结果。
-
公开(公告)号:CN113393854A
公开(公告)日:2021-09-14
申请号:CN202110546236.5
申请日:2021-05-19
Applicant: 出门问问信息科技有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种语音处理方法,包括:构建第一语音数据和第二语音数据的训练对;将第一语音数据和第二语音数据的原始特征分别输入生成模型,生成与第一语音数据对应的第一嵌入数据、及与第二语音数据对应的第二嵌入数据;将第一嵌入数据和第二嵌入数据输入判别模型进行训练,获得判别结果;根据判别模型,用随机梯度下降的方式进行对抗模型学习,获得语音降噪模型;根据语音降噪模型对目标语音数据进行降噪处理。本发明在保证其鲁棒性、在对先验知识依赖比较少的前提下,利用深度学习网络自适应的去充分学习正常信号和噪音信号之间的关联性和差异性,实现较好的语音降噪效果。
-
公开(公告)号:CN112914528A
公开(公告)日:2021-06-08
申请号:CN202110226335.5
申请日:2021-03-01
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种无袖带血压测量方法、装置及计算机可读介质,涉及人工智能技术领域。该方法的一实施例包括:通过获取多个光电容积脉搏波PPG信号及与PPG信号对应的真实血压值;并针对任一PPG信号:对PPG信号进行特征提取,生成目标空时特征;之后将目标空时特征作为样本数据,并将PPG信号对应的真实血压值作为样本标签;并将样本数据和样本标签共同作为训练样本,得到多个训练样本;最后利用算法对多个所述训练样本进行模型训练,生成回归模型。由此,解决了现有技术中由于针对PPG信号提取特征信息不完整导致回归模型预测准确率低的问题,提高了回归模型预测的准确率。
-
公开(公告)号:CN108710704B
公开(公告)日:2021-04-02
申请号:CN201810522824.3
申请日:2018-05-28
Applicant: 出门问问信息科技有限公司
IPC: G06F16/338 , G06N3/04
Abstract: 本发明实施例公开了一种对话状态的确定方法、装置、电子设备及存储介质。该方法包括:将待对话状态识别的对话文本进行序列标注,生成输入序列,其中,所述输入序列中包括所述对话文本的标注槽值;如果通过分类神经网络确定数据库中的存储槽值与所述对话文本的标注槽值不匹配,则通过预先训练的指针神经网络对所述输入序列进行编码,生成结果特征向量;通过所述指针神经网络对所述结果特征向量进行解码,输出用于指示对话状态的目标槽值。上述对话状态的确定方法不需要独立的SLU模块提供中间语义表述,也不需要列举所有可能的槽值备用值,同时该方法在槽值无法事先枚举的情况下追踪目标槽值的能力比较强。
-
公开(公告)号:CN112053687A
公开(公告)日:2020-12-08
申请号:CN202010758331.7
申请日:2020-07-31
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种语音处理方法、装置及设备,方法包括:接收待处理语音的语音数据,待处理语音为第一对象和第二对象的若干轮语音交互过程中由第一对象发出的语音;根据语音数据,利用语义完整度模型,确定待处理语音为完整语音的置信度;根据置信度,确定第二对象对待处理语音进行响应的静音等待时长。本发明根据所接收到的待处理语音的语音数据,利用语义完整度模型,确定待处理语音为完整语音的置信度,有效识别出语义不完整语音信息,从而根据置信度,动态调整第二对象对待处理语音进行响应的静音等待时长,避免用户语音表达未结束时打断用户的情况发生,并且判断语音的语义完整的情况下,缩短静音时长,提高交互效率,大大提高用户体验。
-
公开(公告)号:CN112035608A
公开(公告)日:2020-12-04
申请号:CN202010842174.8
申请日:2020-08-20
Applicant: 出门问问信息科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F40/242 , G06F40/30
Abstract: 本发明公开了一种多轮对话方法、装置以及计算机可读存储介质,包括:接收目标对象通过电话信道所发送的第一输入信息;若第一输入信息所对应且表征目标对象语义的第一中间信息未满足预设条件,则根据第一中间信息反馈目标对象表征反问的第一输出信息,并指示目标对象根据第一输出信息反馈第二输入信息;若第一中间信息和第二输入信息所对应且表征目标对象语义的第二中间信息满足预设条件,则根据第一中间信息和第二中间信息反馈满足目标对象意图的第二输出信息。本方案通过分析得到目标对象每一句话的意图信息,并根据目标对象的意图信息回复目标对象,使对话更接近人与人之间的电话对话,这种主动式的对话引导,使得对话更加智能化。
-
公开(公告)号:CN111191421A
公开(公告)日:2020-05-22
申请号:CN201911396882.7
申请日:2019-12-30
Applicant: 出门问问信息科技有限公司
IPC: G06F40/151
Abstract: 本发明公开一种文本处理方法,用于文本正则化分析的TN规则由n级构成,n为大于等于2的整数,方法包括:获得待分析文本;根据TN规则中的第一级规则匹配待分析文本,获得待分析文本命中的第一级规则;根据命中的第一级规则对应的第二级规则继续匹配待分析文本,获得待分析文本命中的第二级规则;以此类推,根据命中的第m-1级规则对应的第m级规则匹配待分析文本,获得待分析文本命中的第m级规则,m为小于等于n的整数;在待分析文本匹配TN规则结束时,根据待分析文本所命中的各级规则,将待分析文本转换为标准文本输出。本发明还公开一种文本处理装置、计算机存储介质和电子设备。本发明让TN系统更加简洁清晰,规则覆盖更全,规则匹配效率更高。
-
公开(公告)号:CN111078898A
公开(公告)日:2020-04-28
申请号:CN201911374465.2
申请日:2019-12-27
Applicant: 出门问问信息科技有限公司
IPC: G06F16/36
Abstract: 本发明公开了一种多音字标注方法、装置以及计算机可读存储介质,所述方法包括:获取多音字;将所获取的多音字作为预测模型的输入,得到多个对应于所述多音字的读音概率;从歧义规则词库中获取对应于所述多音字的读音权重;根据所获取到的读音概率和读音权重,得到置信度;根据所得到的置信度,对所述多音字进行读音标注。通过设置预测模型结合歧义规则词库,根据读音概率和读音权重对多音字进行标注,较现有技术,有着较高的读音标注准确率。
-
公开(公告)号:CN110661510A
公开(公告)日:2020-01-07
申请号:CN201910991943.8
申请日:2019-10-18
Applicant: 出门问问信息科技有限公司
IPC: H03H21/00
Abstract: 本发明公开波束形成器形成方法、波束形成方法、装置及电子设备。波束形成器形成方法一实施例通过获取波束形成器预抑制方向的白噪声信号;并根据白噪声声源与传声器位置关系确定相对双传声器阵列的参考信号和期望信号;而后基于参考信号和期望信号利用自适应滤波器算法对波束形成器预抑制方向白噪声信号进行抑制,从而得到目标波束形成器。自适应波束形成方法一实施例通过利用目标波束形成器组对双传声阵列输出的音频信号进行滤波处理,并结合空域信噪比算法和平稳噪声降噪算法对目标方向语音信号进行增强,从而降低了自适应波束形成方法的复杂度,并且能够在保证算法良好实用性和鲁棒性的前提下,实现自适应波束形成方法良好的定向收声性能。
-
-
-
-
-
-
-
-
-