针对多轮对话生成回复语句的方法和装置

    公开(公告)号:CN111400481B

    公开(公告)日:2023-04-28

    申请号:CN202010410108.3

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置,方法包括:获取历史上下文;对历史上下文基于注意力机制进行编码,得到历史上下文对应的上下文向量,以及历史上下文对应的第一分词序列的编码注意力分布;对候选知识集合中的各候选知识基于注意力机制进行编码,得到候选知识集合对应的知识融合向量,以及候选知识集合对应的第二分词序列的知识注意力分布;针对回复语句进行逐词预测,其中每次预测包括:对于扩充词表中每个候选词,得到将该候选词作为下一个词的预测概率;扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。

    训练迁移模型,文本风格迁移的方法和装置

    公开(公告)号:CN117764038A

    公开(公告)日:2024-03-26

    申请号:CN202311751326.3

    申请日:2023-12-18

    Abstract: 本说明书实施例提供一种训练迁移模型的方法,进行文本风格迁移的方法和对应装置。其中迁移模型包括,编码解耦网络,重组网络和解码器。训练过程包括:将第一文本输入编码解耦网络,得到与内容相关的内容表征,以及与风格相关的第一风格表征;其中第一文本具有风格标签。通过重组网络,分别施加风格标签对应的正向风格向量和与之相反的反向风格向量,得到第二风格表征和第三风格表征。然后,将第二风格表征和第三风格表征分别与内容表征组合后进行解码,得到第二文本和第三文本。通过分类器得到第三文本的风格类别的预测结果。从而通过预测损失,更新迁移模型,预测损失包括,第一文本和第二文本之间的重构损失,以及第三文本的分类损失。

    一种生成对话下文的方法和系统

    公开(公告)号:CN111382257A

    公开(公告)日:2020-07-07

    申请号:CN202010470216.X

    申请日:2020-05-28

    Abstract: 本说明书实施例公开了一种生成对话下文的方法及系统。所述方法包括:获取对话上文,根据所述对话上文获取与所述对话上文相关的至少一个知识文本,并生成所述至少一个知识文本对应的至少一个知识向量k1~km;所述知识文本存储在知识库中;根据至少一个所述知识向量k1~km和当前时刻的解码隐藏状态St,使用第一注意力模型生成当前时刻的知识融合向量 ;基于所述当前时刻的知识融合向量、当前时刻的上下文向量 以及所述当前时刻的解码隐藏状语组态S成t,所生述成对当话前下时文刻,所的述对y话1表下示文t词=1时语的yt;对y1话~y下t的文对词话语下。文词

    表格生成文本模型的训练方法、表格生成文本方法和装置

    公开(公告)号:CN117892785A

    公开(公告)日:2024-04-16

    申请号:CN202410041377.5

    申请日:2024-01-11

    Inventor: 林谢雄 褚崴

    Abstract: 本说明书的实施例提供了一种用于训练表格生成文本模型的方法和装置。在该用于训练表格生成文本模型的方法中,在每个模型训练过程:利用表格编码模型根据当前训练样本的表格得到表格特征表示;根据该表格以及基于表格中各个数值和预定数值操作进行组合得到的数值操作结果集,生成对应的衍生数值推理图;利用路径生成模型根据表格特征表示和该衍生数值推理图得到衍生值生成路径特征表示;再利用文本解码模型结合表格特征表示、衍生值生成路径特征表示以及衍生词表得到该表格的描述文本;最后根据该描述文本和该表格的文本标签之间的差异确定当前训练过程的损失函数值,进而调整表格编码模型、路径生成模型和文本解码模型当前的模型参数。

    一种数据处理方法、装置及设备

    公开(公告)号:CN115827935B

    公开(公告)日:2023-05-23

    申请号:CN202310152553.8

    申请日:2023-02-09

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标结构化数据,基于目标结构化数据,将目标结构化数据转换为图结构数据,将图结构数据划分为多个不同的子图数据,并基于图结构数据、多个不同的子图数据和对目标结构化数据进行预设的逻辑操作的数据,确定多个不同的子图数据中与预设的逻辑操作的数据相匹配的目标子图数据,预设的逻辑操作的复杂程度高于预设阈值;将目标结构化数据以序列化的方式输入到编码器中,得到目标结构化数据对应的编码序列,并基于编码序列、目标结构化数据对应的嵌入特征数据和目标子图数据,通过解码器生成目标结构化数据对应的群组描述文本,增加了群组成员逻辑操作,提升了文本生成的质量。

    针对多轮对话生成回复语句的方法和装置

    公开(公告)号:CN111400481A

    公开(公告)日:2020-07-10

    申请号:CN202010410108.3

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置,方法包括:获取历史上下文;对历史上下文基于注意力机制进行编码,得到历史上下文对应的上下文向量,以及历史上下文对应的第一分词序列的编码注意力分布;对候选知识集合中的各候选知识基于注意力机制进行编码,得到候选知识集合对应的知识融合向量,以及候选知识集合对应的第二分词序列的知识注意力分布;针对回复语句进行逐词预测,其中每次预测包括:对于扩充词表中每个候选词,得到将该候选词作为下一个词的预测概率;扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。

    一种数据处理方法、装置及设备

    公开(公告)号:CN115827935A

    公开(公告)日:2023-03-21

    申请号:CN202310152553.8

    申请日:2023-02-09

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标结构化数据,基于目标结构化数据,将目标结构化数据转换为图结构数据,将图结构数据划分为多个不同的子图数据,并基于图结构数据、多个不同的子图数据和对目标结构化数据进行预设的逻辑操作的数据,确定多个不同的子图数据中与预设的逻辑操作的数据相匹配的目标子图数据,预设的逻辑操作的复杂程度高于预设阈值;将目标结构化数据以序列化的方式输入到编码器中,得到目标结构化数据对应的编码序列,并基于编码序列、目标结构化数据对应的嵌入特征数据和目标子图数据,通过解码器生成目标结构化数据对应的群组描述文本,增加了群组成员逻辑操作,提升了文本生成的质量。

Patent Agency Ranking