-
公开(公告)号:CN108763230A
公开(公告)日:2018-11-06
申请号:CN201810581372.6
申请日:2018-06-07
Applicant: 南京大学
Abstract: 本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻译方法通过在翻译过程中输入外部信息,为翻译提供了参考,有效提高了神经机器翻译的翻译效率。
-
公开(公告)号:CN101329666A
公开(公告)日:2008-12-24
申请号:CN200810122650.8
申请日:2008-06-18
Applicant: 南京大学
Abstract: 本发明公开了一种基于语料库及树型结构模式匹配的汉语句法自动分析方法,该方法在对汉语标注语料库进行深度分析与完全切分的基础上,根据从语料库中抽取出的句法模式和相应的语义搭配关系,与待处理句进行模式匹配与模式转换处理,并经过语义排歧处理,最后得到最优句法分析结果。本发明的句法自动分析系统包括句法树库中句法模式的抽取、存储、调用模块,句型统计模块、句法模式匹配模块,近似模式局部转换模块,语义排歧模块。实验证明本发明的汉语句法自动分析方法与传统的句法分析相比,注重句法模式的整体匹配与局部转换相结合,处理的粒度大,效率高,平均准确率和召回率有约10%的提高。
-
公开(公告)号:CN112417132A
公开(公告)日:2021-02-26
申请号:CN202011492756.4
申请日:2020-12-17
Applicant: 南京大学
IPC: G06F16/335 , G06F16/38 , G06F40/284 , G06N3/08
Abstract: 本发明提供了一种利用谓宾信息筛选负样本的新意图识别方法,包括如下步骤:步骤1,输入意图标签和人工标注的正样本;步骤2,收集无标注的句子样本,计算无标注样本与意图标签的相似度,排序并筛选后作为用于后续训练意图识别模型的负样本;步骤3,结合正、负样本训练意图识别模型;步骤4,使用训练好的意图识别模型对用户输入进行预测。
-
公开(公告)号:CN112036174A
公开(公告)日:2020-12-04
申请号:CN201910407855.9
申请日:2019-05-15
Applicant: 南京大学
IPC: G06F40/289 , G10L15/26
Abstract: 本公开涉及一种标点标注方法及装置。包括:获取语音识别得到的动态文本,所述动态文本中包括至少一个词语;依次获取所述词语,并将所述词语输入至标注模型,经所述标注模型输出所述词语的预测标点;判断所述预测标点的置信度是否不小于预设值,若所述置信度不小于所述预设值,则在所述词语之后标注所述预测标点。本公开以字或词语作为最小的处理单元,首先通过预测模型对所述字或词进行标点预测,并通过判断置信度的方式,对预测的准确性进行校准,显著的缩短了从音频中出现某个字或词到输出标注结果的时延,输出结果实时性较高,且准确性较强,不需要对标注结果进行二次修正,用户体验好。
-
公开(公告)号:CN108763230B
公开(公告)日:2020-07-21
申请号:CN201810581372.6
申请日:2018-06-07
Applicant: 南京大学
Abstract: 本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻译方法通过在翻译过程中输入外部信息,为翻译提供了参考,有效提高了神经机器翻译的翻译效率。
-
公开(公告)号:CN108717434A
公开(公告)日:2018-10-30
申请号:CN201810460253.5
申请日:2018-05-15
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种混合逐点策略和成对策略的文本排序方法,涉及一种在对句子,句法树等样本排序的过程中更好地利用样本之间的差异信息的排序方法,包括:逐点排序阶段,成对排序阶段。逐点排序阶段对样本进行打分并做第一次排序,并筛选出得分较高的候选,在这些候选基础上,进一步对其进行成对排序阶段,其中成对策略排序采用了一种编码、参照生成、对比、再编码、打分的流程,在参照过程中设计了一种基于跨度的节点加权方法,一种跨度和注意力机制相结合的方法,最后根据样本的基础得分和逐点排序得分,成对排序阶段得分进行综合排序。
-
-
-
-
-