文本压缩方法、装置、存储介质及电子设备

    公开(公告)号:CN118018029A

    公开(公告)日:2024-05-10

    申请号:CN202410038920.6

    申请日:2024-01-10

    Inventor: 景一 杨青

    Abstract: 本发明提供一种文本压缩方法、装置、存储介质及电子设备,该方法包括:获取待压缩文本,并确定待压缩文本的文本表示数据,文本表示数据包括L个向量;确定文本分组方式,并按照文本分组方式对文本表示数据进行分组处理,得到N个子文本表示数据,一个子文本表示数据包括至少一个向量;调用目标压缩模型,分别对N个子文本表示数据中的各个子文本表示数据进行压缩,得到文本压缩结果,且文本压缩结果支持通过目标序列模型被处理。本发明实施例可在避免打乱待压缩文本的原有含义以及避免造成上下文缺失的情况下,通过对待压缩文本的文本压缩,实现对待压缩文本的预处理,从而基于文本压缩结果实现通过目标序列模型对文本表示数据的处理。

Patent Agency Ranking