-
公开(公告)号:CN111666734A
公开(公告)日:2020-09-15
申请号:CN202010334370.4
申请日:2020-04-24
Applicant: 北京大学
IPC: G06F40/117 , G06F40/289 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种序列标注方法及装置。其中,方法包括:获取待分析的句子;将待分析的句子输入至序列标注模型,输出句子的分词结果及每个词的标注结果;其中,序列标注模型是基于样本句子及样本句子对应的分词和标注数据进行基于强化学习的训练获得的。本发明实施例提供的序列标注方法及装置,通过强化学习技术隐式地学习文本的分词信息,能缓解中文序列标注中分词与目标的不匹配。
-
公开(公告)号:CN111666734B
公开(公告)日:2021-08-10
申请号:CN202010334370.4
申请日:2020-04-24
Applicant: 北京大学
IPC: G06F40/117 , G06F40/289 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种序列标注方法及装置。其中,方法包括:获取待分析的句子;将待分析的句子输入至序列标注模型,输出句子的分词结果及每个词的标注结果;其中,序列标注模型是基于样本句子及样本句子对应的分词和标注数据进行基于强化学习的训练获得的。本发明实施例提供的序列标注方法及装置,通过强化学习技术隐式地学习文本的分词信息,能缓解中文序列标注中分词与目标的不匹配。
-