基于知识图谱的神经机器翻译方法、装置、设备及介质

    公开(公告)号:CN114118104A

    公开(公告)日:2022-03-01

    申请号:CN202111199951.2

    申请日:2021-10-14

    Abstract: 本发明提供一种基于知识图谱的神经机器翻译方法、装置、设备及介质,该方法包括:获取原始双语平行语句对,根据原始双语平行语句对提取单词和短语翻译对,得到对应的种子实体翻译对;获取源语言知识图谱和目标语言知识图谱,根据种子实体翻译对、源语言知识图谱和目标语言知识图谱,构建对应的向量空间;获取到待翻译实体集合时,根据向量空间对待翻译实体集合进行推断,得到对应的待翻译实体翻译对;计算种子实体翻译对和待翻译实体翻译对的距离,根据距离得到包含待翻译实体翻译对的伪双语平行句对。本发明通过将知识图谱融合到神经机器翻译中,利用知识图谱中丰富的实体知识提升了神经机器翻译的实体翻译准确率。

    融合文本语义特征的语音翻译方法、系统、设备

    公开(公告)号:CN112800782A

    公开(公告)日:2021-05-14

    申请号:CN202110127939.4

    申请日:2021-01-29

    Abstract: 本发明属于机器翻译领域,具体涉及一种融合文本语义特征的语音翻译方法、系统、设备,旨在解决现有语音翻译方法难以融合不同模态之间的信息,无法充分利用语音识别和机器翻译领域的数据,导致翻译性能较差的问题。本发明方法包括获取待翻译的源语言语音数据;提取源语言语音数据对应的语音特征序列;并获取各语音特征对应的声学表征;将声学表征的隐向量映射到源语言词表,并通过softmax函数得到语音特征序列每个时刻被识别为源语言词表中的词语的概率;对声学表征进行过滤处理,并通过第二编码器得到过滤后的声学特征对应的语义表征;基于语义表征,通过解码器得到源语言语音数据对应的目标语言翻译文本。本发明提高了语音翻译的性能。

    人机混合的应答方法、系统、装置

    公开(公告)号:CN109783704B

    公开(公告)日:2021-02-02

    申请号:CN201910005704.0

    申请日:2019-01-03

    Abstract: 本发明属于人机对话技术领域,具体涉及一种人机混合的应答方法、系统、装置,旨在为了解决现有人机应答方法无法实现在线学习的问题。本发明方法包括:对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);基于对话任务下的候选回复语句,并进行编码后得到第二表征向量基于第一表征向量E(Ct)、第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则选择置信度对应的候选回复语句进行应答输出,否则获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出,并基于应答输出后得到的全部对话语句进行上述步骤中的参数优化。本发明保证了输出的应答语句具有足够的置信度,实现了对话模型的在线学习更新。

    神经语义编解码分析方法及系统

    公开(公告)号:CN112232084A

    公开(公告)日:2021-01-15

    申请号:CN202011102971.9

    申请日:2020-10-15

    Abstract: 本发明涉及一种神经语义编解码分析方法及系统,所述神经语义编解码分析方法包括:训练回归模型拟合脑神经激活水平与文本刺激的向量表示之间的映射关系,建立文本表示模型;通过探针任务量化解析文本表示模型描述各类语言特征的能力,得到探针任务表现;根据探针任务表现,通过消融任务以调整文本表示模型;在调整后的文本表示模型生成的句子向量的基础上来执行分析任务。本发明通过训练回归模型拟合脑神经激活水平与文本刺激的向量表示之间的映射关系,建立文本表示模型,通过探针任务量化解析文本表示模型描述各类语言特征的能力;进一步通过消融任务确认文本表示模型的鲁棒性,并以此调整文本表示模型,从而可提高在执行分析任务时的准确率。

    基于QA知识库推理的多轮对话回复选择方法、系统

    公开(公告)号:CN110096567B

    公开(公告)日:2020-12-25

    申请号:CN201910192600.5

    申请日:2019-03-14

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于QA知识库推理的多轮多话回复选择方法、系统,旨在解决人机多轮对话交互系统中回复选择的问题。本发明方法包括:以当前多轮对话提取的关键词、当前输入作为问题从QA知识库中检索出候选问题集合,并获取相应的上下文,构建候选多轮对话集合;计算当前输入与候选问题的语义相似度为第一相似度;计算当前输入的上下文与各候选问题上下文的语义相似度为第二相似度;计算当前多轮对话与各候选多轮对话的摘要信息的相似度为第三相似度;三个相似度加权求和得到各候选问题与当前输入的相似度,将相似度最大的候选问题对应的回复作为输出回复。本发明可以有效提高回复语句的质量,增强用户体验。

    基于原型记忆的小数据词表示学习方法与系统及相关设备

    公开(公告)号:CN110008480B

    公开(公告)日:2020-12-11

    申请号:CN201811479634.4

    申请日:2018-12-05

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于原型记忆的小数据词表示学习方法与系统及相关设备,目的在于解决传统的分布语义模型为了得到高质量的词表示,要求每个目标词具有大量的上下文样本的问题。本发明的基于原型记忆的小数据词表示学习方法包括:根据通用领域语料库,对键值记忆储存模型进行初始化;根据通用领域语料库学习词表示,并在键值记忆储存模型中存储词的原型表示;根据罕见词语料库,利用键值记忆储存模型,学习罕见词的词表示。本发明中原型表示的构建使得模型不再需要逐个记忆所有过往样本,同时具有更好的泛化能力。在利用大规模语料中完成知识积累后,在小规模语料中给定有限上下文的情况下,快速学习目标词的表示。

    融合规则信息的可控制性对话管理扩展方法

    公开(公告)号:CN108268616B

    公开(公告)日:2020-09-01

    申请号:CN201810009140.3

    申请日:2018-01-04

    Abstract: 本发明属于人机对话技术领域,具体涉及一种融合规则信息的可控制性对话管理扩展方法,旨在解决数据驱动的对话系统通过重新构建交互环境的方式进行扩展时成本高、效率低下的问题,本方法包括:S1,基于交互数据,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;S2,基于新用户意图,构建该新用户意图对应的新对话规则;S3,基于交互数据、原对话管理模块的对话策略、新对话规则,构建新对话管理模块映射空间所需满足的约束;S4,基于S3中得到的新对话管理模块映射空间所需满足的约束,对原对话管理模块进行扩展,生成新对话管理模块。本发明可以对数据驱动的对话系统根据用户反馈进行快速扩展、高效迭代。

    基于改进的PageRank算法的文本-音频自动文摘方法

    公开(公告)号:CN107015966B

    公开(公告)日:2019-07-19

    申请号:CN201710195609.2

    申请日:2017-03-28

    Abstract: 本发明提供了一种基于改进的PageRank算法的文本‑音频自动文摘方法,包括:将音频转录为文本,计算转录文本和原始文本的相似度;利用改进的PageRank算法根据相似度计算转录文本和原始文本中的句子的重要性;以及根据句子的重要性,生成文本摘要。通过改进PageRank算法,引导排序,修改了跨模态句子之间的相似度矩阵,使得来自不同模态的两个语义相同的句子之间的连接指向从原来的双向变为单向,实现了原始文本句子与转录文本句子语义相同时,按照原始文本句子进行输出,在保证获取较多重要信息量同时,避免了转录带来的语法错误和不通顺的问题,提高了文本‑音频自动文摘的可读性。

    篇章因果关系判断方法、系统、装置

    公开(公告)号:CN109918646A

    公开(公告)日:2019-06-21

    申请号:CN201910089352.1

    申请日:2019-01-30

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种篇章因果关系判断方法、系统、装置,旨在为了解决机器人交互中的篇章因果关系判断问题。本发明方法包括:基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;基于所述目标文本对、两个注册事件的相关性,计算所述目标文本对的因果关系。本发明可以对输入的目标文本对进行因果关系的准确判断。

    图文摘要的评价方法
    40.
    发明公开

    公开(公告)号:CN109543512A

    公开(公告)日:2019-03-29

    申请号:CN201811173277.9

    申请日:2018-10-09

    Abstract: 本发明属于自然语言技术领域,具体提供一种图文摘要的评价方法及装置,旨在解决现有技术缺少对图文摘要进行评价从而导致摘要以单模态形式输出的问题。为此目的,本发明提供了一种图文摘要的评价方法,包括计算预先获取的待测摘要的文本和参考摘要的文本之间的ROUGE值;获取待测摘要的图片和参考摘要的图片之间的准确度;基于预先构建的图文相似度计算模型获取待测摘要中图片和文本的相似度;基于预先构建的图文摘要评价模型并根据ROUGE值、准确度以及相似度获取对待测摘要的评价值。基于上述步骤,本发明提供的方法可以从多个方面综合考虑影响摘要评价的因素,可以很好地模拟人工评价的过程,进而提高摘要评价的准确度和处理效率。

Patent Agency Ranking