CTC模型的训练方法和数据处理方法、装置及存储介质

    公开(公告)号:CN111340117A

    公开(公告)日:2020-06-26

    申请号:CN202010124513.9

    申请日:2020-02-27

    Abstract: 本说明书涉及一种联结主义时间分类(CTC)模型的训练方法和装置,在该方法中,将特征向量分别输入第一全连接层和第二全连接层;确定特征向量和标签序列的联合表示向量后输入第三全连接层;然后,CTC损失层根据各层输出的归一化结果确定标签序列的似然分布和空白字符先验分布,从而确定本次训练的梯度值,完成一次训练。本说明书还提供了基于上述CTC模型的数据处理方法和装置、电子设备以及计算机可读存储介质。

    图像生成方法、图像生成模型的训练方法及系统

    公开(公告)号:CN118941441A

    公开(公告)日:2024-11-12

    申请号:CN202411108186.2

    申请日:2024-08-12

    Abstract: 本说明书提供一种图像生成方法、图像生成模型的训练方法及系统。图像生成方法包括:获得目标文本和至少一个目标风格图像,目标文本用于指示目标图像的内容,所述至少一个目标风格图像用于指示目标图像的风格,确定目标文本的目标文本token、所述至少一个目标风格图像的目标风格token,目标文本token用于表征目标文本中的内容,目标风格token用于表征所述至少一个目标风格图像中的风格,根据目标文本token和目标风格token生成目标图像。通过引入指示目标图像的风格的目标风格图像,可以更准确地描述风格并生成该风格的图像。通过token的方式从风格和内容维度生成目标图像,可以避免风格和文本之间的混淆。

    情感识别模型的训练方法及装置
    55.
    发明公开

    公开(公告)号:CN116910511A

    公开(公告)日:2023-10-20

    申请号:CN202310848401.1

    申请日:2023-07-11

    Abstract: 本说明书实施例披露一种情感识别模型的训练方法及装置。该方法包括:首先,获取训练样本集,其中各个训练样本包括情感类别标签、与情感识别任务强相关的强特征和其他的若干弱特征;然后,利用情感识别模型处理各个训练样本,具体包括:在特征对齐层,将强特征和若干弱特征分别映射到相同的特征空间,对应得到强映射表征和若干弱映射表征;在权重计算层,基于强映射表征计算若干弱映射表征对应的若干权重;在特征提取层,利用若干权重处理若干弱映射表征得到若干提取表征;在特征融合层,对强映射表征和若干提取表征进行融合处理,得到融合表征;在情感预测层,基于融合表征确定情感识别结果;基于情感类别标签和情感识别结果,训练情感识别模型。

    针对目标图像的类别识别方法和装置

    公开(公告)号:CN112926700B

    公开(公告)日:2022-04-12

    申请号:CN202110460794.X

    申请日:2021-04-27

    Abstract: 本说明书实施例提供一种针对目标图像的类别识别方法和装置,所述目标图像中包括文本,所述方法包括:识别所述目标图像中的文本内容,得到第一文本识别结果;将所述目标图像输入图像编码器,通过所述图像编码器输出所述目标图像对应的第一图像语义特征向量;将所述第一文本识别结果输入文本编码器,通过所述文本编码器输出所述第一文本识别结果对应的第一文本语义特征向量;将所述第一图像语义特征向量和所述第一文本语义特征向量输入多模融合编码器,通过所述多模融合编码器输出第一全局特征向量;根据所述第一全局特征向量,确定所述目标图像的目标类别。能够提高针对目标图像的类别识别的准确率。

    具有多模态信息的检索对象的检索方法和装置

    公开(公告)号:CN113076433A

    公开(公告)日:2021-07-06

    申请号:CN202110454387.8

    申请日:2021-04-26

    Abstract: 本说明书实施例提供一种具有多模态信息的检索对象的检索方法和装置,方法包括:获取单模态的查询信息,单模态的查询信息为第一文本或第一图片;当查询信息为第一文本时,将第一文本输入生成模型,生成与第一文本包含的主体对应的图像特征;将第一文本对应的文本特征和图像特征输入图文转换器,对文本特征和图像特征进行基于自注意力的融合,输出查询信息的第一查询特征向量;根据第一查询特征向量与各检索特征向量之间的相似度,确定与查询信息相匹配的检索对象;各检索特征向量分别对应于数据库中的各检索对象,任一检索特征向量为将其对应的检索对象的多模态信息输入图文转换器得到的。能够提高检索精度。

    针对目标图像的类别识别方法和装置

    公开(公告)号:CN112926700A

    公开(公告)日:2021-06-08

    申请号:CN202110460794.X

    申请日:2021-04-27

    Abstract: 本说明书实施例提供一种针对目标图像的类别识别方法和装置,所述目标图像中包括文本,所述方法包括:识别所述目标图像中的文本内容,得到第一文本识别结果;将所述目标图像输入图像编码器,通过所述图像编码器输出所述目标图像对应的第一图像语义特征向量;将所述第一文本识别结果输入文本编码器,通过所述文本编码器输出所述第一文本识别结果对应的第一文本语义特征向量;将所述第一图像语义特征向量和所述第一文本语义特征向量输入多模融合编码器,通过所述多模融合编码器输出第一全局特征向量;根据所述第一全局特征向量,确定所述目标图像的目标类别。能够提高针对目标图像的类别识别的准确率。

Patent Agency Ranking