基于人机交互场景的语音识别纠错方法、装置以及设备

    公开(公告)号:CN113035200B

    公开(公告)日:2022-08-05

    申请号:CN202110236299.0

    申请日:2021-03-03

    Inventor: 李锐 刘权 陈志刚

    Abstract: 本发明公开了一种基于人机交互场景的语音识别纠错方法、装置以及设备,本发明的构思在于充分利用人机交互场景中多轮问答机制,将机器抛出的本轮问询内容与相应的用户答复内容经由语言识别处理获得的若干相关转写结果相结合,并从二者的语义层面进行深层挖掘,获得涉及本轮问询及若干答复语音的中间识别结果等上下文相关信息的综合表征,进而再对该综合表征进行解码,便可以精准、可靠地得到用户当前答复的正确识别文本。本发明的覆盖度、通用性可以得到显著提升,并且是对语音识别过程中的相关识别文本融入与真实交互场景息息相关的信息,因而实施复杂度也远低于单纯迁移语言模型进行纠错的现有方案,所以能够更易于被业内接受、认可及推广使用。

    一种图谱构建方法及其相关设备

    公开(公告)号:CN114254121A

    公开(公告)日:2022-03-29

    申请号:CN202111481742.7

    申请日:2021-12-06

    Abstract: 本申请公开了一种图谱构建方法及其相关设备,该方法包括:在获取到包括至少一组因果事件的待使用文本之后,先从该待使用文本抽取至少一个待使用原因事件;再根据各待使用原因事件和该待使用文本,确定各待使用原因事件对应的结果事件;最后,根据至少一个待使用原因事件和该至少一个待使用原因事件对应的结果事件,确定因果事件图谱,以使该因果事件图谱用于记录该待使用文本中所存在的因果关系,如此能够实现自动构建因果事件图谱的目的,从而能够降低因果事件图谱的构建成本。

    文本表示方法、装置、电子设备与存储介质

    公开(公告)号:CN114118022A

    公开(公告)日:2022-03-01

    申请号:CN202111452650.6

    申请日:2021-12-01

    Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。

    一种弹幕广告投放方法及装置

    公开(公告)号:CN109003149B

    公开(公告)日:2021-08-17

    申请号:CN201811289181.9

    申请日:2018-10-31

    Abstract: 本申请公开了一种弹幕广告投放方法及装置,该方法包括:在播放待投放弹幕广告的目标视频时,首先检测播放平台的弹幕功能是否处于开启状态,其中,目标视频中植入了至少一个广告,接着,如果确定弹幕功能处于开启状态,则可以在目标视频播放到每一植入广告的同时,以弹幕的方式显示该植物广告对应的广告提示。可见,本申请在视频播放到植入广告时,可以以弹幕的方式显示其广告提示,且该广告提示可以是任意风格的能够吸引用户注意的提示,因此,当以弹幕方式显示该广告提示时,提高了用户对视频中植入式广告的关注度,进而提升了植入式广告的传播效果。

    游戏语音交互方法及装置

    公开(公告)号:CN107773982B

    公开(公告)日:2021-08-13

    申请号:CN201710986387.6

    申请日:2017-10-20

    Abstract: 本发明实施例提供一种游戏语音交互方法及装置,属于语音识别领域。该方法包括:获取对语音数据进行语音识别后得到的文本数据,将文本数据拆分为文本元素,并将每一文本元素转化为文本向量;基于每一文本向量,生成特征矩阵,并将特征矩阵输入至指令识别模型,输出语音数据对应的操作指令,操作指令为游戏指令或非游戏指令,游戏指令用于操控游戏玩家对应的游戏角色,非游戏指令用于游戏玩家之间互相沟通。由于游戏玩家通过语音输入的方式,除了实现与其它游戏玩家之间互相沟通之外,还可实现对其对应的游戏角色进行操控,从而在便捷游戏玩家操控的同时,拓展了游戏中语音交互的功能,进而在整体层面上提升了游戏玩家的体验。

    视频摘要的生成方法、电子设备及计算机可读存储介质

    公开(公告)号:CN113055741A

    公开(公告)日:2021-06-29

    申请号:CN202011622336.3

    申请日:2020-12-31

    Abstract: 本申请公开了一种视频摘要的生成方法、电子设备及计算机可读存储介质,其中,所述视频摘要的生成方法包括:获取源视频,将所述源视频划分为多个单位视频片段;根据每个所述单位视频片段对应的弹幕信息,从所述多个单位视频片段中筛选出若干个所述单位视频片段作为关键视频片段;根据时间顺序将所有所述关键视频片段进行拼接,生成所述源视频对应的视频摘要。上述方案,能够生成个性化的视频摘要。

    语义理解方法、装置、设备及存储介质

    公开(公告)号:CN112800775A

    公开(公告)日:2021-05-14

    申请号:CN202110117912.7

    申请日:2021-01-28

    Abstract: 本申请公开了一种语义理解方法、装置、设备及存储介质,本申请对于待理解文本,在其所属场景下的各类型实体词中获取与待理解文本相匹配的实体词,以及获取待理解文本所属语种的语种特征,基于待理解文本与匹配实体词确定融合文本,基于融合文本及语种特征,确定待理解文本的语义理解结果。本申请能够针对不同语种、不同场景下的待理解文本进行语义的理解,并且过程中考虑待理解文本所属语种,能够区分不同语种特性,保障对各种不同语种的待理解文本的语义理解效果。同时,通过引入待理解文本所属语种及场景下的匹配实体词,使得本申请的语义理解方案能够适用于对不同语种、不同场景下待理解文本的语义理解,提升待理解文本的语义理解准确度。

    语义识别模型训练方法、识别方法、电子设备、存储介质

    公开(公告)号:CN112686051A

    公开(公告)日:2021-04-20

    申请号:CN202011572659.6

    申请日:2020-12-22

    Abstract: 本发明提供一种语义识别模型训练方法、识别方法、电子设备、存储介质。其中,语义识别模型训练方法包括:建立预置数据库,所述预置数据库包括多个预置问题;利用所述预置问题对初始模型进行训练,以得到初始语义模型;将所述初始语义模型与语言模型进行拼接,以得到所述语义识别模型;其中,所述语言模型用于识别文本中字与字之间的语言学关系;所述初始语义模型用于识别所述文本中字或词在所述文本中的语义含义。以此提高模型语义理解能力。

    一种语义理解模型构建方法及装置、语义理解方法及装置

    公开(公告)号:CN112633007A

    公开(公告)日:2021-04-09

    申请号:CN202011519649.6

    申请日:2020-12-21

    Inventor: 王涛 刘权 陈志刚

    Abstract: 本申请公开了一种语义理解模型构建方法及装置、语义理解方法及装置,该语义理解模型构建方法包括:在获取到多语语料之后,先根据该多语语料生成训练样本、该训练样本的实际语种和该训练样本的实际语义信息,并将该训练样本输入多语种理解模型,得到该多语种理解模型输出的该训练样本的预测语种和该训练样本的预测语义信息;再根据该训练样本的预测语种、实际语种、预测语义信息及其实际语义信息,更新该多语种理解模型,并继续执行上述将该训练样本输入多语种理解模型的步骤,直至在达到预设停止条件时,根据该多语种理解模型构建语义理解模型,以使该语义理解模型能够对该至少两个语种下的语句进行语义理解。

Patent Agency Ranking