文本生成方法、装置、介质和计算设备

    公开(公告)号:CN110110331A

    公开(公告)日:2019-08-09

    申请号:CN201910362399.0

    申请日:2019-04-30

    Applicant: 清华大学

    Inventor: 邵智宏 黄民烈

    Abstract: 本发明的实施方式提供了一种文本生成方法。该方法包括:将文本生成任务规划为多个文本块生成子任务;重复执行以下文本块生成子任务直到所有子任务执行完毕:基于输入数据集合的子集组合序列中的当前子集以及在先子任务生成文本块。根据本发明的文本生成方法,在生成文本过程中模拟人类的写作过程,合理规划文章结构和各个部分的内容,能够使得长文本中的句子与前后文之前取得较高的一致性和流畅性,并且更加全面的覆盖输入数据集合。此外,本发明的实施方式提供了一种文本生成装置、介质和计算设备。

    基于推理步骤串接的数值推理方法、系统及存储介质

    公开(公告)号:CN116151373A

    公开(公告)日:2023-05-23

    申请号:CN202211516319.0

    申请日:2022-11-29

    Applicant: 清华大学

    Inventor: 黄民烈 邵智宏

    Abstract: 本发明提供一种基于推理步骤串接的数值推理方法、系统及存储介质,包括:基于经过目标函数训练后的数值推理模型根据文本形式的数值推理问题构建计算图的节点表示;根据所述图节点的表示进行运算类型解码,确定运算类型分布概率;在每一步运算中将与其匹配的操作数进行串联,确定操作数的概率,生成有向无环图;通过所述数值推理模型选择一个图节点的数值运算结果作为问题的答案。本发明解决了现有数值推理模型对推理步骤间逻辑依赖建模不够灵活、错误率高的问题。

    问答模型的训练方法、问答方法及装置

    公开(公告)号:CN114925178A

    公开(公告)日:2022-08-19

    申请号:CN202210190420.5

    申请日:2022-02-28

    Abstract: 本申请提供了一种问答模型的训练方法、模型的训练方法、问答方法、数据处理方法及装置,涉及人工智能领域,该问答模型的训练方法包括:根据问题重构模型的预测结果确定第一候选推理方案,第一候选推理方案属于训练样本对应的多个候选推理方案,问题重构模型的预测结果用于指示基于训练样本中的问题的条件信息和候选推理方案重构出训练样本中的问题的评价值;基于训练样本和第一候选推理方案训练问答模型,本申请的方案能够缓解有害的推理方案对模型训练的负面影响,提高模型的训练效果,有利于得到正确推理方案。

    文本生成方法、装置、介质和计算设备

    公开(公告)号:CN110110331B

    公开(公告)日:2021-02-26

    申请号:CN201910362399.0

    申请日:2019-04-30

    Applicant: 清华大学

    Inventor: 邵智宏 黄民烈

    Abstract: 本发明的实施方式提供了一种文本生成方法。该方法包括:将文本生成任务规划为多个文本块生成子任务;重复执行以下文本块生成子任务直到所有子任务执行完毕:基于输入数据集合的子集组合序列中的当前子集以及在先子任务生成文本块。根据本发明的文本生成方法,在生成文本过程中模拟人类的写作过程,合理规划文章结构和各个部分的内容,能够使得长文本中的句子与前后文之前取得较高的一致性和流畅性,并且更加全面的覆盖输入数据集合。此外,本发明的实施方式提供了一种文本生成装置、介质和计算设备。

    基于文本扩展的对抗样本生成方法、装置、介质和设备

    公开(公告)号:CN112232057B

    公开(公告)日:2024-03-01

    申请号:CN202010998716.0

    申请日:2020-09-21

    Applicant: 清华大学

    Inventor: 黄民烈 邵智宏

    Abstract: 本发明的实施方式提供了一种基于文本扩展的对抗样本生成方法、装置、介质和设备。该方法包括:分析原始文本的句法结构,获取其中可被修饰的目标成分;根据原始文本的句法结构确定修饰目标成分的修饰语类型;以所述目标成分和修饰语类型为输入,通过文本生成模型生成修饰语;在所述目标成分的位置之后插入所述修饰语,以生成所述对抗样本。本发明通过插入修饰语的方式对原始文本进行扩展来生成对抗样本,极大地丰富了对抗样本的语句表达形式,并且保证了文本的句法结构正确性以及文本本身的可读性。

    大语言模型驱动的开放域自然语言推理问答系统及方法

    公开(公告)号:CN116932708A

    公开(公告)日:2023-10-24

    申请号:CN202310414399.7

    申请日:2023-04-18

    Applicant: 清华大学

    Abstract: 本发明提供一种大语言模型驱动的开放域自然语言推理问答系统及方法,问题改写模块将用户问题改写为改写问题;中心计算和管理模块管理大语言模型的计算和知识资源,根据改写问题的类型将改写问题和问题核心引擎模块所需的大语言模型的计算和知识资源输出至问答核心引擎模块中的一个或多个子问答模块;问答核心引擎模块根据改写问题和大语言模型的计算和知识资源推理得到一个或多个改写问题的候选答案和候选答案的可解释性说明信息;聚合推理模块根据一个或多个改写问题的候选答案和候选答案的可解释性说明信息聚合推理得到改写问题的最终答案和最终答案的可解释性说明信息,采用大语言模型支撑,支持问题类型全面、易扩展、可解释且通用性强。

    基于文本扩展的对抗样本生成方法、装置、介质和设备

    公开(公告)号:CN112232057A

    公开(公告)日:2021-01-15

    申请号:CN202010998716.0

    申请日:2020-09-21

    Applicant: 清华大学

    Inventor: 黄民烈 邵智宏

    Abstract: 本发明的实施方式提供了一种基于文本扩展的对抗样本生成方法、装置、介质和设备。该方法包括:分析原始文本的句法结构,获取其中可被修饰的目标成分;根据原始文本的句法结构确定修饰目标成分的修饰语类型;以所述目标成分和修饰语类型为输入,通过文本生成模型生成修饰语;在所述目标成分的位置之后插入所述修饰语,以生成所述对抗样本。本发明通过插入修饰语的方式对原始文本进行扩展来生成对抗样本,极大地丰富了对抗样本的语句表达形式,并且保证了文本的句法结构正确性以及文本本身的可读性。

Patent Agency Ranking