一种针对中英神经机器翻译模型的数据投毒样本生成器

    公开(公告)号:CN117973400A

    公开(公告)日:2024-05-03

    申请号:CN202410153185.3

    申请日:2024-02-02

    Applicant: 东北大学

    Abstract: 本发明提供一种针对中英神经机器翻译模型的数据投毒样本生成器,涉及数据投毒技术领域。本发明包括获取句子序列的依存关系之类的句法信息;将句子序列与处理后输入到BERT模型中获取句子序列的特征向量以及句子序列中每个单词的特征向量;基于依存关系构建图;使用图注意力网络获取上下文语义特征向量;获取单词实体的特征向量;将各个特征向量融合为多特征融合特征向量;多特征融合特征向量送入关系分类器进行关系分类;接入大模型;使用大模型依据得到的关系生成中英双语句对的样本。本发明能够高效高质量的代替人工生成针对中英神经机器翻译模型生成数据投毒样本。

    一种基于金融事理知识图谱的推理问答方法

    公开(公告)号:CN118035414A

    公开(公告)日:2024-05-14

    申请号:CN202410172686.6

    申请日:2024-02-07

    Applicant: 东北大学

    Abstract: 本发明提供一种基于金融事理知识图谱的推理问答方法,涉及计算机科学与技术的自然语言处理技术领域。该方法包括:获取句子级或篇章级的语料并进行预处理,构建语料数据集并随机划分训练集,采用课程学习的方法将训练集中的语料按照语料的难度等级分组;构建事件抽取模型并训练;获取未作标注的生语料并输入事件抽取模型中抽取事件与事件关系,构建候选事件的事理知识图谱;获取问题并提取目标事件;根据目标事件在候选事件的事理知识图谱中检索候选事件,将候选事件进行向量化表示并更新,再利用线性层对新的候选事件的事件表示进行事件预测;根据候选事件的预测结果确定问题中目标事件的预测回答,优化了传统知识图谱难以进行事件推理的缺陷。

Patent Agency Ranking