-
公开(公告)号:CN115408495A
公开(公告)日:2022-11-29
申请号:CN202211023077.1
申请日:2022-08-25
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F16/9536 , G06F40/247 , G06F40/284 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本申请提出了一种基于多模态检索和关键词提取的社交文本增强方法,包括:S1、利用类别关键词抽取算法提取不同类别样本语句中的关键词;S2、采用RNN模型结合自注意力机制的方式,利用训练样本训练得到句子的生成模型,并根据所述训练样本对应类别的关键词控制所述生成模型的句子生成方向;S3、将原始语句输入到所述生成模型中,生成文本增强的第一生成语句;S4、基于多模态检索算法,判断所述第一生成语句是否存在所述关键词文件中的关键词,若是,则在所述第一生成语句中找出需要替换的关键词,并检索出所述需要替换的关键词的近义词进行替换,从而生成多个数据增强的第二生成语句。本申请具有能够对生成模型的生成方向、生成数量进行控制的效果。