语音的交互方法、装置、设备及存储介质

    公开(公告)号:CN116434751A

    公开(公告)日:2023-07-14

    申请号:CN202310484755.2

    申请日:2023-04-28

    Abstract: 本申请提出一种语音的交互方法、装置、设备及存储介质,该方法包括:基于语音信息,确定文本;将文本输入到语言模型中,确定文本的意图和文本的槽位;根据文本的意图和文本的槽位,确定文本指令。从而有效地解决了当用户表达不清、语音识别不准时,会产生槽位缺失的问题,也可以对齐不同的实体名称,减少歧义,提升了用户的使用体验,能够实现与用户之间准确地信息交互,系统可以根据用户的语音准确识别得到对应的文本指令,并根据文本指令执行对应的操作,从而能够达到高效准确的语音交互,减少了系统无法理解用户语义的情况。

    文本标点恢复方法及相关设备
    4.
    发明公开

    公开(公告)号:CN115374766A

    公开(公告)日:2022-11-22

    申请号:CN202211058771.7

    申请日:2022-08-31

    Abstract: 本申请提供一种文本标点恢复方法及相关设备。该方法包括:获取待处理文本的特征信息;将特征信息输入标点预测模型,得到输出结果;特征信息包括多个第一片段,输出结果包括第一片段的各个第一预测语句在第一片段中的位置、第一片段的各个第一预测语句的标点类别的概率和第一片段的各个第一预测语句的标点类别的置信度;基于输出结果进行第一预测语句的冗余剔除,得到恢复标点的文本。这样能够通过一次待处理文本的特征信息的输入得到恢复标点的文本,不需要循环输入每一个文字来判断该文字后是否有标点,提高了文本标点恢复效率。

    用于自然语言处理、训练自然语言处理模型的方法及设备

    公开(公告)号:CN115713079A

    公开(公告)日:2023-02-24

    申请号:CN202110947769.4

    申请日:2021-08-18

    Abstract: 本公开涉及一种用于自然语言处理的方法及训练自然语言处理模型的方法、电子设备,以及计算机可读存储介质,涉及自然语言处理技术领域。用于自然语言处理的方法包括:获取文本数据;利用自然语言处理模型,对所述文本数据进行处理,得到输出信息,其中,所述自然语言处理模型包括第一注意力模型,所述第一注意力模型包括顺序编码矩阵,所述顺序编码矩阵用于在所述文本数据的基础上增加所述文本数据中的至少一个词与其他词之间的顺序关系信息。根据本公开,通过在第一注意力模型中增加顺序编码矩阵,可以使自然语言处理模型更方便、更快速地学习文本数据的语序信息,以更方便、更快速地理解文本数据的语义信息,从而可以提高自然语言处理的准确性。

    图像处理方法及装置、图像检测方法及系统、存储介质

    公开(公告)号:CN114519690A

    公开(公告)日:2022-05-20

    申请号:CN202011307773.6

    申请日:2020-11-19

    Abstract: 本申请提供了一种图像处理方法及装置、图像检测方法及系统、存储介质。该图像处理方法包括:获取目标图像和补偿信号,存储目标图像;对目标图像的像素进行计数,得到计数值;根据计数值,在目标图像的边缘像素的外围位置添加补偿信号对应的补偿数据,得到补偿后的目标图像的像素数据。本申请可实现对图像边缘像素的补偿,使后续的卷积操作可以扩展至边缘像素,从而可使输入的图像和输出的图像大小一致,以保持目标图像的信息完整性,避免遗失重要信息。

    图像处理方法及装置、图像检测方法及系统、存储介质

    公开(公告)号:CN114519690B

    公开(公告)日:2025-05-09

    申请号:CN202011307773.6

    申请日:2020-11-19

    Abstract: 本申请提供了一种图像处理方法及装置、图像检测方法及系统、存储介质。该图像处理方法包括:获取目标图像和补偿信号,存储目标图像;对目标图像的像素进行计数,得到计数值;根据计数值,在目标图像的边缘像素的外围位置添加补偿信号对应的补偿数据,得到补偿后的目标图像的像素数据。本申请可实现对图像边缘像素的补偿,使后续的卷积操作可以扩展至边缘像素,从而可使输入的图像和输出的图像大小一致,以保持目标图像的信息完整性,避免遗失重要信息。

    文字识别结果获取方法、控制装置及可读存储介质

    公开(公告)号:CN117975471A

    公开(公告)日:2024-05-03

    申请号:CN202410217387.X

    申请日:2024-02-27

    Abstract: 本申请涉及音视频数据处理分析技术领域,具体提供一种文字识别结果获取方法、控制装置及可读存储介质,旨在解决在确保文字识别结果的准确性前提下,如何提升识别模型的泛化能力的问题。为此目的,本申请根据模型输入数据的输入类型,获取训练好的多模态识别模型中的模态丢弃概率,根据模态丢弃概率和模型输入数据,应用训练好的多模态识别模型对模型输入数据进行识别,获得文字识别结果。本申请的多模态识别模型通过设置模态丢弃概率,能够实现单模态的数据作为模型输入数据,也能够实现多模态的数据作为模型输入数据,且训练好的多模态识别模型是通过预训练获得,能够在确保文字识别结果的准确性的前提下,提升多模态识别模型的泛化能力。

Patent Agency Ranking