-
公开(公告)号:CN114492332A
公开(公告)日:2022-05-13
申请号:CN202210101812.X
申请日:2022-01-27
Applicant: 南京大学
IPC: G06F40/166 , G06F40/56
Abstract: 本发明涉及一种基于变分自编码器隐变量操纵的受控文本生成方法,包括:训练一个用于文本生成的变分自编码器;计算变分自编码器的隐变量与生成文本的属性之间的关联;通过操纵变分自编码器的隐变量生成具有指定属性的文本。本发明提供的受控文本生成方法可以只使用一个训练好的变分自编码器模型控制生成文本的多种不同属性,并且可以使用具有不同属性的文本共同提升生成文本的质量。
-
公开(公告)号:CN113535969B
公开(公告)日:2023-11-03
申请号:CN202010313425.3
申请日:2020-04-20
Applicant: 南京大学
IPC: G06F16/36 , G06F40/205 , G06F40/30 , G06F40/151 , G06F18/22
Abstract: 本公开涉及计算机技术领域,尤其涉及一种语料扩充方法、装置、计算机设备及存储介质。所述方法包括:获取平行种子集、第一语料库和第二语料库,根据平行种子集、第一语料库和第二语料库,训练选择模型,对于第一语料库中的每个第一文本,通过训练完成的选择模型从第二语料库中确定匹配的第二文本;根据第一语料库中的多个第一文本和各自匹配的第二文本,构成多组伪平行文本对;对多组伪平行文本对进行筛选,将筛选后的多组伪平行文本对添加至平行种子集中。本公开实施例通过使用选择模型学习多个第一文本和多个第二文本之间的映射关系,避免了相关技术中因无法做到内容风格完全解耦而导致的风格转换失败的问题,保证了后续的语料生成效果。
-
公开(公告)号:CN113535969A
公开(公告)日:2021-10-22
申请号:CN202010313425.3
申请日:2020-04-20
Applicant: 南京大学
IPC: G06F16/36 , G06F40/205 , G06F40/30 , G06F40/151 , G06K9/62
Abstract: 本公开涉及计算机技术领域,尤其涉及一种语料扩充方法、装置、计算机设备及存储介质。所述方法包括:获取平行种子集、第一语料库和第二语料库,根据平行种子集、第一语料库和第二语料库,训练选择模型,对于第一语料库中的每个第一文本,通过训练完成的选择模型从第二语料库中确定匹配的第二文本;根据第一语料库中的多个第一文本和各自匹配的第二文本,构成多组伪平行文本对;对多组伪平行文本对进行筛选,将筛选后的多组伪平行文本对添加至平行种子集中。本公开实施例通过使用选择模型学习多个第一文本和多个第二文本之间的映射关系,避免了相关技术中因无法做到内容风格完全解耦而导致的风格转换失败的问题,保证了后续的语料生成效果。
-
-