名称匹配方法、训练方法、设备及存储介质

    公开(公告)号:CN114510944A

    公开(公告)日:2022-05-17

    申请号:CN202210153195.8

    申请日:2022-02-18

    Abstract: 本说明书一个或多个实施例提供一种名称匹配方法、训练方法、设备及存储介质。所述方法包括:获取待匹配名称的名称字符串;根据预先训练好的神经网络将所述待匹配名称的名称字符串转换成表征向量;其中,所述神经网络用于将同一名称的不同变体的字符串均转换成同一表征向量;确定所述待匹配名称的表征向量分别与预存的若干参考名称的表征向量之间的相似度;其中,所述参考名称的表征向量为将所述参考名称的任一变体的字符串输入所述神经网络得到;根据所述相似度确定所述待匹配名称与所述参考名称是否匹配。本实施例有利于提高匹配效率和匹配准确性。

    建立转译模型的方法、转译方法和对应装置

    公开(公告)号:CN114118108A

    公开(公告)日:2022-03-01

    申请号:CN202111330368.0

    申请日:2021-11-11

    Abstract: 本说明书实施例提供了一种建立转译模型的方法、转译方法和对应装置,根据本说明书实施例,首先获取包含多个训练样本的训练数据;然后利用训练数据训练包含编码器、文本解码器和语音解码器的辅助模型;其中,将训练样本的源语言文本作为编码器的输入,由编码器输出该源语言文本的特征表示;文本解码器利用特征表示预测该源语言文本的目标语言文本;语音解码器利用特征表示预测该源语言文本的语音索引文本;辅助模型的训练目标为:最小化文本解码器的预测结果与训练样本中对应目标语言文本的差异以及最小化语音解码器的预测结果与训练样本中对应语音索引文本的差异;再利用训练得到的辅助模型中的编码器和文本解码器得到转译模型。

    对抗样本的生成方法和装置
    4.
    发明公开

    公开(公告)号:CN112990383A

    公开(公告)日:2021-06-18

    申请号:CN202110510166.8

    申请日:2021-05-11

    Abstract: 本说明书实施例提供了一种对抗样本的生成方法和装置。该方法中,首先获取原始样本;根据所述原始样本,得到至少两个原始向量;从所述至少两个原始向量中选择出待扰动向量;对待扰动向量添加对抗扰动,得到扰动向量;在预先设置的向量池中检索与扰动向量相近似的向量;其中,所述向量池中包括根据各历史原始样本得到的各历史原始向量;根据检索到的相近似的向量,得到对抗样本。

    字符编码模型的训练方法、字符匹配方法和装置

    公开(公告)号:CN115147849A

    公开(公告)日:2022-10-04

    申请号:CN202210686424.2

    申请日:2022-06-17

    Abstract: 本说明书实施例描述了字符编码模型的训练方法、字符匹配方法和装置。根据实施例的方法,首先获取样本训练集,然后针对各个样本训练集进行编码处理。进一步,利用各个样本训练集得到的表征向量可以计算损失函数值。最后,利用得到的损失函数值即可训练字符编码模型。由于训练模型的每一个样本训练集中包含有标准字符串、正样本字符串和负样本字符串,而且正样本字符串和标准字符串表征的对象相同,负样本字符串和标准字符串表征的对象不同。如此在利用得到的模型对字符串进行编码时,能够使表征同一对象的字符串的表征向量相似度更高,而使表征不同对象的字符串的表征向量相似度更低,从而在进行字符串匹配时能够提高字符串匹配的准确性。

Patent Agency Ranking