用于验证表述的真实性的方法、设备、装置和介质

    公开(公告)号:CN114065741B

    公开(公告)日:2023-08-11

    申请号:CN202111356625.8

    申请日:2021-11-16

    Abstract: 根据本公开的实现方式,提供了用于验证表述的真实性的方法、设备、装置和介质。在一种方法中,获取包括表述、证据集和标签的训练数据,表述表示被验证的内容,证据集包括用于支持验证表述的真实性的至少一个证据,以及标签表示基于证据集来验证表述的真实性的结果。基于对表述的语法分析,将表述划分为多个短语。基于训练数据和多个短语来训练短语验证模型,以使得短语验证模型基于证据集来分别确定多个短语的多个短语真实性。基于训练数据和多个短语来训练表述验证模型,以使得表述验证模型基于证据集来确定表述的表述真实性,其中多个短语真实性对表述真实性提供解释。以此方式,以更为精细的粒度处理表述并且为表述真实性提供更多解释。

    用于改写叙事性文本的方法、设备、装置和介质

    公开(公告)号:CN114091414A

    公开(公告)日:2022-02-25

    申请号:CN202111400842.2

    申请日:2021-11-19

    Abstract: 根据本公开的实施例,提供了改写叙事性文本的方法、设备、装置和介质。该方法包括确定对叙事性文本中的一个语句的改变。改变前的语句的初始上下文与改变后的语句的目标上下文不同。该方法还包括基于叙事性文本中在语句之后的文本部分与目标上下文的不一致性,对文本部分执行至少一个编辑操作,以生成文本部分的至少一个经编辑版本。该方法进一步包括用至少一个经编辑版本中的经编辑版本替换文本部分,作为经改写的叙事性文本。以此方式,能够在保证上下文连贯性的同时以较少的编辑量改写叙事性文本。

    知识图谱实体概念描述生成系统

    公开(公告)号:CN113672737A

    公开(公告)日:2021-11-19

    申请号:CN202010401139.2

    申请日:2020-05-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种知识图谱实体概念描述生成系统,用于根据知识图谱中实体所对应的包含属性以及值的信息框生成该实体的概念描述文本,其特征在于,包括:词模板生成模块,存储有一个预训练完成的第一序列到序列模型,该第一序列到序列模型包括信息框编码器以及模板解码器,信息框编码器用于将待处理实体所对应的信息框重建为单词序列并编码为第一隐状态,模板解码器用于根据第一隐状态输出模板序列;概念描述文本生成模块,存储有一个预训练完成的第二序列到序列模型,第二序列到序列模型包括模板编码器以及概念描述解码器,模板编码器用于将模板序列编码为第二隐状态,概念描述解码器用于根据第一隐状态以及第二隐状态输出概念描述文本。

    中文自然语言转数据库语言的方法及装置

    公开(公告)号:CN113536741B

    公开(公告)日:2022-10-14

    申请号:CN202010303263.5

    申请日:2020-04-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。

    用于验证表述的真实性的方法、设备、装置和介质

    公开(公告)号:CN114065741A

    公开(公告)日:2022-02-18

    申请号:CN202111356625.8

    申请日:2021-11-16

    Abstract: 根据本公开的实现方式,提供了用于验证表述的真实性的方法、设备、装置和介质。在一种方法中,获取包括表述、证据集和标签的训练数据,表述表示被验证的内容,证据集包括用于支持验证表述的真实性的至少一个证据,以及标签表示基于证据集来验证表述的真实性的结果。基于对表述的语法分析,将表述划分为多个短语。基于训练数据和多个短语来训练短语验证模型,以使得短语验证模型基于证据集来分别确定多个短语的多个短语真实性。基于训练数据和多个短语来训练表述验证模型,以使得表述验证模型基于证据集来确定表述的表述真实性,其中多个短语真实性对表述真实性提供解释。以此方式,以更为精细的粒度处理表述并且为表述真实性提供更多解释。

    中文自然语言转数据库语言的方法及装置

    公开(公告)号:CN113536741A

    公开(公告)日:2021-10-22

    申请号:CN202010303263.5

    申请日:2020-04-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。

    文档生成系统
    7.
    发明授权

    公开(公告)号:CN113673210B

    公开(公告)日:2023-12-01

    申请号:CN202010401491.6

    申请日:2020-05-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种文档生成系统,用于根据高相关性的历史文档材料自动生成新的文档,其特征在于,包括:输入数据获取模块,用于获取训练数据以及用户输入的待分析文档材料,该训练数据包括多个高重复性的历史文档材料以及与该历史文档材料的文本内容相关的多种相关材料;论据信息抽取组合模块,用于对待分析文档材料进行论据信息的抽取并组合为相应的论据段,存储有预先根据训练数据训练完成并且用于识别句子的类型的分类器以及用于抽取相应类型的句子的模板规则;论点信息匹配生成模块,用于根据论据段生成相应的论点信息,存储有预先根据训练数据训练完成的论点生成模型;文档生成模块,用于根据论据段以及论点信息生成新的文档材料。

    文档生成系统
    8.
    发明公开

    公开(公告)号:CN113673210A

    公开(公告)日:2021-11-19

    申请号:CN202010401491.6

    申请日:2020-05-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种文档生成系统,用于根据高相关性的历史文档材料自动生成新的文档,其特征在于,包括:输入数据获取模块,用于获取训练数据以及用户输入的待分析文档材料,该训练数据包括多个高重复性的历史文档材料以及与该历史文档材料的文本内容相关的多种相关材料;论据信息抽取组合模块,用于对待分析文档材料进行论据信息的抽取并组合为相应的论据段,存储有预先根据训练数据训练完成并且用于识别句子的类型的分类器以及用于抽取相应类型的句子的模板规则;论点信息匹配生成模块,用于根据论据段生成相应的论点信息,存储有预先根据训练数据训练完成的论点生成模型;文档生成模块,用于根据论据段以及论点信息生成新的文档材料。

Patent Agency Ranking