语音交互方法及装置
    1.
    发明公开

    公开(公告)号:CN117219082A

    公开(公告)日:2023-12-12

    申请号:CN202311003782.X

    申请日:2023-08-09

    Abstract: 本申请涉及语音交互领域,提供一种语音交互方法及装置。所述方法包括:接收用户语音输入;对用户语音输入进行语音识别,得到识别文本;基于有向无环图按照句式模板对多个字段进行逐字识别,在结束有向无环图的字段识别的情况下,得到语义理解结果;其中,句式模板包括多个槽位,每个槽位对应一类字段,每个槽位包括至少一个关键词,有向无环图包括开始节点,多个中间节点和结束节点,每个中间节点关联一个槽位。本申请提供的语音交互方法能够在语音解析流程结束时仅输出一个语义理解结果,减少了因对信息相同的识别结果进行重复解析而造成的计算资源浪费,提高了语音解析效率,进而提高了语音交互的响应速度。

    命令词识别方法、装置、设备及存储介质

    公开(公告)号:CN117409770A

    公开(公告)日:2024-01-16

    申请号:CN202310934276.6

    申请日:2023-07-27

    Abstract: 本申请涉及语音识别技术领域,提供一种命令词识别方法、装置、设备及存储介质。所述方法包括获取待识别的语音信息,并提取所述语音信息的音频特征;对所述音频特征进行压缩处理,并将压缩后的音频特征输入到经过预训练的命令词识别模型中,对所述语音信息中的命令词进行识别。本申请实施例提供的命令词识别方法,通过对音频特征进行压缩,可以剔除音频特征中的静音片段等无效信息,将压缩后的音频特征输入到经过预训练的命令词识别模型,对语音信息中的命令词进行识别时,可以避免或减少数据填充,从而减少计算资源的浪费。

    多任务语义理解方法、装置、电子设备和存储介质

    公开(公告)号:CN116933796A

    公开(公告)日:2023-10-24

    申请号:CN202310883789.9

    申请日:2023-07-18

    Abstract: 本申请涉及自然语言处理技术领域,提供了一种多任务语义理解方法、装置、电子设备和存储介质,包括获取待理解的文本;将文本输入至预先确定的多任务语义理解模型,得到多任务语义理解模型输出的理解结果,理解结果包括领域信息、意图信息和词槽信息,领域信息用于确定领域限定向量,领域限定向量用于限定意图信息和词槽信息的领域。本申请使用领域限制向量对意图和词槽的识别任务做领域内的限制,使得意图和词槽的识别结果限制在相应的单一领域内,能够规避识别的意图结果、词槽结果与领域结果不符的情况,进而提升多任务联合模型的识别准确率。

Patent Agency Ranking