零资源跨语言对话模型训练方法、装置、设备和介质

    公开(公告)号:CN116805004B

    公开(公告)日:2023-11-14

    申请号:CN202311058414.5

    申请日:2023-08-22

    Abstract: 本发明涉及自然语言处理技术领域,提供一种零资源跨语言对话模型训练方法、装置、设备和介质,所述方法包括:基于初始样本源语言对话数据,构建扩充样本源语言对话数据、第一跨语言对话数据、第二跨语言对话数据、双语平行数据以及样本目标语言对话数据;基于扩充样本源语言对话数据、第一跨语言对话数据以及第二跨语言对话数据中的至少一种,和双语平行数据,训练得到教师模型;将样本目标语言对话数据的对话输入数据输入至教师模型,得到蒸馏对话回复数据;基于样本目标语言对话数据的对话输入数据以及蒸馏对话回复数据进行蒸馏训练,得到零资源跨语言对话模型。本发明快速且低成本为零资源目标语言构建零资源跨语言对话模型。

    文本翻译方法、装置、电子设备及存储介质

    公开(公告)号:CN116882423A

    公开(公告)日:2023-10-13

    申请号:CN202311143071.2

    申请日:2023-09-06

    Abstract: 本发明提供一种文本翻译方法、装置、电子设备及存储介质,应用于机器翻译技术领域,该方法包括:获取待翻译文本的第一文本序列,所述第一文本序列包括至少两个相邻语句和每两个相邻语句之间的句间关系分隔符;确定所述第一文本序列中每个词段的向量,得到第一向量序列;确定所述至少两个相邻语句的句间关系向量,并将所述第一向量序列中句间关系分隔符的向量更新为所述句间关系向量,得到第二向量序列;基于所述第二向量序列确定所述待翻译文本的译文文本;其中,所述句间关系向量用于表示所述至少两个相邻语句的关联关系。

    异常账号检测方法、装置、电子设备及存储介质

    公开(公告)号:CN116882409A

    公开(公告)日:2023-10-13

    申请号:CN202311154862.5

    申请日:2023-09-08

    Inventor: 亢晓勉 宗成庆

    Abstract: 本发明提供一种异常账号检测方法、装置、电子设备及存储介质,应用于社交媒体分析技术领域。该方法包括:获取待测账号的账号信息;根据所述账号信息确定所述待测账号的序列特征、文本特征以及数值特征;将所述序列特征、所述文本特征以及所述数值特征进行特征融合处理,得到所述待测账号的目标表示向量;基于所述目标表示向量检测所述待测账号是否为异常账号;其中,所述序列特征用于表示所述待测账号的发帖内容变化趋势和发帖数量变化趋势;所述文本特征用于表示与所述待测账号相关的文本内容的特征,所述数值特征用于表示所述待测账号的热度和关注度。

    面向多任务对话的大语言模型训练方法和交互方法

    公开(公告)号:CN116821290A

    公开(公告)日:2023-09-29

    申请号:CN202310638543.5

    申请日:2023-05-31

    Abstract: 本发明提供一种面向多任务对话的大语言模型训练方法和交互方法,其中面向多任务对话的大语言模型训练方法包括:获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型,不仅在极大程度上保留了模型的闲聊交互能力,还最大限度的提升了模型的任务识别能力和任务执行能力,使其能够具备快速准确地识别任务类别和任务目标的能力,优化了模型性能。

    基于注意力机制的知识图谱长尾关系补全方法

    公开(公告)号:CN111291139B

    公开(公告)日:2023-08-22

    申请号:CN202010189960.2

    申请日:2020-03-17

    Inventor: 周玉 孙建 宗成庆

    Abstract: 本发明属于知识图谱领域,具体涉及一种基于注意力机制的知识图谱长尾关系补全方法、系统、装置,旨在解决传统的关系补全模型因长尾关系数目稀少导致对长尾关系预测产生过拟合的问题。本系统方法:获取待补全的知识图谱,并根据其实体之间的关系类型将其构建为第一知识图谱和第二知识图谱;获取第一知识图谱中融合邻域信息的实体向量表示,作为第一表示;根据第一表示对第二知识图谱中各实体进行向量化表示,并构建支撑集和查询集;通过预设的多种网络类型的长尾关系预测方法获取查询集中各实体对的关系类型标签,并补全各实体之间的关系。本发明通过对知识图谱中各实体的邻域信息进行融合,避免了长尾关系预测时过拟合的问题。

    对比学习模型的训练方法及装置、汉字表示方法及装置

    公开(公告)号:CN115062787A

    公开(公告)日:2022-09-16

    申请号:CN202210581040.4

    申请日:2022-05-25

    Abstract: 本发明提供一种对比学习模型的训练方法及装置、汉字表示方法及装置,其中对比学习模型的训练方法包括:基于相似汉字混淆集中的各混淆汉字构建相似汉字簇集合,所述相似汉字簇集合包括字音相似汉字簇集合和字形相似汉字簇集合;根据所述字音相似汉字簇集合、所述字形相似汉字簇集合构建样本汉字三元组集合;将所述样本汉字三元组集合输入对比学习模型进行训练,直至达到训练停止条件。利用包含有字音相似汉字簇集合和字形相似汉字簇集合的样本汉字三元组集合对对比学习模型进行训练,可以得到汉字之间字音字形的相似关系,丰富了汉字之间字音字形相似关系的表达。

    多语言翻译方法、装置、电子设备及存储介质

    公开(公告)号:CN114139556A

    公开(公告)日:2022-03-04

    申请号:CN202111271484.X

    申请日:2021-10-29

    Abstract: 本发明提供一种多语言翻译方法、装置、电子设备及存储介质,方法包括:获取训练数据和源语言的文本;其中,训练数据包括源语言到多种目标语言的双语平行句对和多语言平行句对;对源语言的文本进行编码,得到源语言的文本对应的特征向量;其中,特征向量与目标语言无关;基于特征向量和多种目标语言已生成的译文,确定多种目标语言的当前词的最终表示;基于语言独立的柱搜索算法及多种目标语言的当前词的最终表示,对多种目标语言的已生成最优候选译文进行扩展,得到多种目标语言的目标译文。本发明提供的方法,能够利用多种目标语言之间的互补信息,生成多种目标语言的目标译文,同时提升多种目标语言的翻译质量。

    多语言机器翻译模型训练方法、多语言翻译方法及装置

    公开(公告)号:CN114048760A

    公开(公告)日:2022-02-15

    申请号:CN202111138690.3

    申请日:2021-09-27

    Abstract: 本发明提供一种多语言机器翻译模型训练方法、多语言翻译方法及装置。训练方法包括:获取多语言翻译训练语料和多语言翻译验证语料;建立并初始化全参数共享的多语言翻译模型,利用多语言翻译训练语料和多语言翻译验证语料对多语言翻译模型进行训练,得到多语言机器翻译模型。在训练过程中模型自动判断每个共享的参数是否需要转变为语言相关的参数,复制需要转变的参数并将其分配给相关的语言,从而使得模型同时具有共享参数和语言相关参数。本发明用于在多语言机器翻译模型训练的过程中,自动判断参数是否需要共享以及需要被哪些语言对共享,而不依赖预先指定的共享或语言相关的模型组件。

    对话系统中口语理解的跨语言迁移方法

    公开(公告)号:CN109213851B

    公开(公告)日:2021-05-25

    申请号:CN201810724523.9

    申请日:2018-07-04

    Abstract: 本发明涉及语言处理领域,并提出了一种对话系统中口语理解的跨语言迁移方法,旨在解决在对话系统中口语理解的跨语言迁移中,因语义标签难以迁移和语言文化差异造成迁移结果质量不佳的技术问题。为此目的,本发明中的口语的跨语言迁移方法包括:获取待迁移的有标注口语理解数据;利用预先构建的口语理解迁移模型对所述带类别标记的待迁移数据进行迁移,得到带类别标记的第一迁移结果;对第一迁移结果进行文化迁移,得到目标语言的口语理解数据。基于上述步骤,本发明可以快速、准确的对口语理解数据进行跨语言迁移,改善了因为双语带类别标记数据不足而导致的有监督训练方法效果不佳的问题,降低了在模型训练中的数据收集和标注成本。

    基于知识驱动的对话策略网络优化方法、系统、装置

    公开(公告)号:CN112131372A

    公开(公告)日:2020-12-25

    申请号:CN202011337142.9

    申请日:2020-11-25

    Abstract: 本发明属于人机对话领域,具体涉及一种基于知识驱动的对话策略网络优化方法、系统、装置,旨在解决医疗领域现有对话系统优化过程中训练数据利用率低的问题。本发明方法应用于对话系统的训练,包括:基于选定领域对话样本的输入特征,利用基于编码器的协同过滤的方法,对自编码器进行优化;所述自编码器中的编码器用于将输入特征映射到低维空间;基于包含额外奖励值的损失函数,对对话策略网络进行优化;所述额外奖励值与行为动作空间中状态‑动作对出现的频率呈反比例关系。本发明可在有限的训练数据的情况下充分地探索状态动作空间,提高数据利用率。

Patent Agency Ranking