对话篇章解析方法
    1.
    发明授权

    公开(公告)号:CN113377915B

    公开(公告)日:2022-07-19

    申请号:CN202110692574.X

    申请日:2021-06-22

    Applicant: 厦门大学

    Abstract: 本发明公开了一种对话篇章解析方法、介质和设备,其中方法包括:获取历史对话信息,并对历史对话信息进行预处理,以生成初始训练样本;根据初始训练样本生成第一训练样本和第二训练样本;根据第一训练样本进行模型训练,以得到结构自感知教师模型;根据第二训练样本进行模型训练,以得到结构自感知学生模型,并拉近结构自感知教师模型的结构关系和结构自感知学生模型的结构关系,以得到最终结构自感知学生模型;获取待解析对话信息,并将待解析对话信息输入到最终结构自感知学生模型,以生成对应待解析对话信息的对话轮次间篇章关系;能够自动对对话信息进行解析,避免因引入显式预测结果而导致的错误传播;同时,提高篇章解析效果。

    基于抽象语法树结构信息增强的代码生成方法

    公开(公告)号:CN114385178B

    公开(公告)日:2024-07-23

    申请号:CN202111531597.9

    申请日:2021-12-14

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于抽象语法树结构信息增强的代码生成方法和介质,其中方法包括:获取人工标注的代码生成数据,其中,代码生成数据包括自然语言句子和对应的目标代码;采用解析器对目标代码进行解析,以得到目标代码对应的抽象语法树,以便根据抽象语法树得到抽象语法树的预测序列,并将自然语言句子和抽象语法树的预测序列作为训练数据;建立代码生成模型,并使用训练数据对代码生成模型进行训练,其中,代码生成模型包括编码器、解码器、历史信息增强模块和未来信息增强模块;将获取的待处理的自然语言句子输入到训练好的代码生成模型进行转换,以生成待处理的自然语言句子对应的目标代码和抽象语法树,从而减小模型的预测误差。

    基于抽象语法树结构信息增强的代码生成方法

    公开(公告)号:CN114385178A

    公开(公告)日:2022-04-22

    申请号:CN202111531597.9

    申请日:2021-12-14

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于抽象语法树结构信息增强的代码生成方法和介质,其中方法包括:获取人工标注的代码生成数据,其中,代码生成数据包括自然语言句子和对应的目标代码;采用解析器对目标代码进行解析,以得到目标代码对应的抽象语法树,以便根据抽象语法树得到抽象语法树的预测序列,并将自然语言句子和抽象语法树的预测序列作为训练数据;建立代码生成模型,并使用训练数据对代码生成模型进行训练,其中,代码生成模型包括编码器、解码器、历史信息增强模块和未来信息增强模块;将获取的待处理的自然语言句子输入到训练好的代码生成模型进行转换,以生成待处理的自然语言句子对应的目标代码和抽象语法树,从而减小模型的预测误差。

    融入迭代式句对关系预测的图神经网络句子排序方法

    公开(公告)号:CN113869033A

    公开(公告)日:2021-12-31

    申请号:CN202111123744.9

    申请日:2021-09-24

    Applicant: 厦门大学

    Abstract: 本发明公开了一种融入迭代式句对关系预测的图神经网络句子排序方法和介质,其中方法包括:构建句子实体图;通过初始句对顺序分类器对所述句子实体图进行分析,以预测所述句子实体图中相连句对的顺序;根据所述句子实体图中相连句对的顺序进行训练,以得到迭代句对顺序分类器,并通过所述迭代句对顺序分类器对所述句子实体图中连边的权重进行迭代更新;根据迭代更新后的句子实体图进行训练,以得到句子排序模型;获取待排序句子信息,并将所述待排序句子信息输入到所述句子排序模型,以通过所述句子排序模型输出待排序句子信息对应的句子排序方式;能够有效提高句子排序的准确性。

    融入迭代式句对关系预测的图神经网络句子排序方法

    公开(公告)号:CN113869033B

    公开(公告)日:2024-08-09

    申请号:CN202111123744.9

    申请日:2021-09-24

    Applicant: 厦门大学

    Abstract: 本发明公开了一种融入迭代式句对关系预测的图神经网络句子排序方法和介质,其中方法包括:构建句子实体图;通过初始句对顺序分类器对所述句子实体图进行分析,以预测所述句子实体图中相连句对的顺序;根据所述句子实体图中相连句对的顺序进行训练,以得到迭代句对顺序分类器,并通过所述迭代句对顺序分类器对所述句子实体图中连边的权重进行迭代更新;根据迭代更新后的句子实体图进行训练,以得到句子排序模型;获取待排序句子信息,并将所述待排序句子信息输入到所述句子排序模型,以通过所述句子排序模型输出待排序句子信息对应的句子排序方式;能够有效提高句子排序的准确性。

    基于译文树结构解码路径动态选择的机器翻译方法

    公开(公告)号:CN113869069B

    公开(公告)日:2024-08-06

    申请号:CN202111063749.7

    申请日:2021-09-10

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法树生成训练数据;进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型;获取待翻译源语言句子,并将待翻译源语言句子输入到基于译文树结构解码路径动态选择的机器翻译模型,以通过基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;能够有效提高机器翻译过程中成分句法树的生成效率,提高机器翻译准确率。

    基于译文树结构解码路径动态选择的机器翻译方法

    公开(公告)号:CN113869069A

    公开(公告)日:2021-12-31

    申请号:CN202111063749.7

    申请日:2021-09-10

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法树生成训练数据;进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型;获取待翻译源语言句子,并将待翻译源语言句子输入到基于译文树结构解码路径动态选择的机器翻译模型,以通过基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;能够有效提高机器翻译过程中成分句法树的生成效率,提高机器翻译准确率。

    对话篇章解析方法
    8.
    发明公开

    公开(公告)号:CN113377915A

    公开(公告)日:2021-09-10

    申请号:CN202110692574.X

    申请日:2021-06-22

    Applicant: 厦门大学

    Abstract: 本发明公开了一种对话篇章解析方法、介质和设备,其中方法包括:获取历史对话信息,并对历史对话信息进行预处理,以生成初始训练样本;根据初始训练样本生成第一训练样本和第二训练样本;根据第一训练样本进行模型训练,以得到结构自感知教师模型;根据第二训练样本进行模型训练,以得到结构自感知学生模型,并拉近结构自感知教师模型的结构关系和结构自感知学生模型的结构关系,以得到最终结构自感知学生模型;获取待解析对话信息,并将待解析对话信息输入到最终结构自感知学生模型,以生成对应待解析对话信息的对话轮次间篇章关系;能够自动对对话信息进行解析,避免因引入显式预测结果而导致的错误传播;同时,提高篇章解析效果。

    对话篇章解析方法
    9.
    发明公开

    公开(公告)号:CN117076638A

    公开(公告)日:2023-11-17

    申请号:CN202311053134.5

    申请日:2023-08-21

    Applicant: 厦门大学

    Abstract: 本发明公开了一种对话篇章解析方法,包括:获取对话数据;对对话数据进行文本序列化处理,以得到序列化的对话历史信息、篇章关系类别描述信息和篇章结构标注信息;构建篇章解析模型,并将序列化的对话历史信息、篇章关系类别描述信息和篇章结构标注信息输入到篇章解析模型,以便对篇章解析模型进行训练;获取待解析的对话信息,并将待解析的对话信息输入到训练好的篇章解析模型,以便通过训练好的篇章解析模型对待解析的对话信息进行解析,以得到对应的篇章结构;由此,能够将该任务建模为文本生成任务,避免引入额外解码器,仅通过预训练模型完成预测,从而能通过扩大模型规模有效提升模型性能。

    明喻句式的成分抽取方法、装置、计算机可读介质及设备

    公开(公告)号:CN115688765A

    公开(公告)日:2023-02-03

    申请号:CN202211338577.4

    申请日:2022-10-28

    Applicant: 厦门大学

    Abstract: 本申请的实施例提供了一种明喻句式的成分抽取方法、装置、计算机可读介质及设备。该方法包括:确定待处理文本对应的分词结果、分词掩码矩阵以及基于句法依存关系的邻接矩阵;对词性为名词的分词进行词义检索,得到所述待处理文本对应的名词释义集合;将所述待处理文本与所述名词释义集合进行拼接,并输入至BERT编码器中,得到对应的文本表示矩阵;将所述文本表示矩阵与所述分词掩码矩阵相乘,得到对应的词结点矩阵;基于GAT算法对所述词结点矩阵和所述邻接矩阵进行表示更新,以得到所述待处理文本对应的结点表示;基于所述结点表示,对所述待处理文本进行明喻成分抽取。本申请实施例的技术方案提高明喻句式中成分识别以及抽取的准确性。

Patent Agency Ranking