一种文本生成的方法、装置、存储介质及电子设备

    公开(公告)号:CN117078995A

    公开(公告)日:2023-11-17

    申请号:CN202310723079.X

    申请日:2023-06-16

    Abstract: 本说明书公开了一种文本生成的方法、装置、存储介质及电子设备,获取待识别图像,从待识别图像中确定出各对象所在的图像区域,作为从待识别图像中提取出的各目标图像。将各目标图像以及预设的用于描述所有类别对象的第一文本输入到预设的识别模型中,以使识别模型从各目标图像提取出图像特征,以及从第一文本中提取出文本特征,并根据各目标图像的图像特征和第一文本的文本特征之间的相似度,确定每个目标图像中包含的对象所属的类别。将各目标图像的图像特征以及类别输入到预设的文本生成模型中,以使文本生成模型根据各目标图像的图像特征和类别输出用于描述待识别图像的内容的描述文本。

Patent Agency Ranking