-
公开(公告)号:CN114417794A
公开(公告)日:2022-04-29
申请号:CN202210315507.0
申请日:2022-03-29
Applicant: 北京大学
IPC: G06F40/166 , G16H10/20
Abstract: 本申请涉及一种量表问题生成模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取目标临床量表数据集;针对每一个临床量表语句对,在预设的多种文本破坏方式中,确定临床量表语句对对应的文本破坏方式;多种文本破坏方式包括疑问词插入;根据临床量表语句对对应的文本破坏方式,对临床量表语句对中的目标临床量表语句进行文本破坏处理,得到目标临床量表语句对应的破坏临床量表语句;根据各临床量表语句对、以及各目标临床量表语句对应的破坏临床量表语句,构成量表语料训练数据集;采用量表语料训练数据集,对目标模型进行模型训练,得到量表问题生成模型。采用本方法能够自动生成量表问题,提高效率。
-
公开(公告)号:CN114417794B
公开(公告)日:2022-09-09
申请号:CN202210315507.0
申请日:2022-03-29
Applicant: 北京大学
IPC: G06F40/166 , G16H10/20
Abstract: 本申请涉及一种量表问题生成模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取目标临床量表数据集;针对每一个临床量表语句对,在预设的多种文本破坏方式中,确定临床量表语句对对应的文本破坏方式;多种文本破坏方式包括疑问词插入;根据临床量表语句对对应的文本破坏方式,对临床量表语句对中的目标临床量表语句进行文本破坏处理,得到目标临床量表语句对应的破坏临床量表语句;根据各临床量表语句对、以及各目标临床量表语句对应的破坏临床量表语句,构成量表语料训练数据集;采用量表语料训练数据集,对目标模型进行模型训练,得到量表问题生成模型。采用本方法能够自动生成量表问题,提高效率。
-