-
公开(公告)号:CN113742445B
公开(公告)日:2022-09-27
申请号:CN202110807246.X
申请日:2021-07-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/35 , G06F40/247 , G06F40/30
Abstract: 本发明提供一种文本识别样本获取、文本识别方法及装置,所述获取方法包括:将初始文本样本输入至样本生成模型,得到样本生成模型输出的多个文本识别样本。由于样本生成模式是基于生成器和识别器进行对偶学习得到的,从而可以得到多个高质量的文本识别样本,且各文本识别样本以不同的语义方式表达两个事件之间的因果关系或非因果关系,进而将高质量的文本识别样本用于文本识别模型训练时,能够提高文本识别模型的识别精度。同时本发明在初始文本样本的基础上得到多个文本识别样本,扩大了样本的数量规模,进而在文本识别样本用于文本识别模型训练时,能够使得文本识别模型能够准确学习文本识别样本中事件的因果语义关系,提高模型的识别精度。
-
公开(公告)号:CN113742445A
公开(公告)日:2021-12-03
申请号:CN202110807246.X
申请日:2021-07-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/35 , G06F40/247 , G06F40/30
Abstract: 本发明提供一种文本识别样本获取、文本识别方法及装置,所述获取方法包括:将初始文本样本输入至样本生成模型,得到样本生成模型输出的多个文本识别样本。由于样本生成模式是基于生成器和识别器进行对偶学习得到的,从而可以得到多个高质量的文本识别样本,且各文本识别样本以不同的语义方式表达两个事件之间的因果关系或非因果关系,进而将高质量的文本识别样本用于文本识别模型训练时,能够提高文本识别模型的识别精度。同时本发明在初始文本样本的基础上得到多个文本识别样本,扩大了样本的数量规模,进而在文本识别样本用于文本识别模型训练时,能够使得文本识别模型能够准确学习文本识别样本中事件的因果语义关系,提高模型的识别精度。
-