基于小样本的医疗数值抽取和理解方法及装置

    公开(公告)号:CN114357144A

    公开(公告)日:2022-04-15

    申请号:CN202210221233.9

    申请日:2022-03-09

    Applicant: 北京大学

    Abstract: 本发明提供一种基于小样本的医疗数值抽取和理解方法及装置,该方法包括:基于正则化表达式,对目标医疗文本进行数值抽取;基于prompt函数,获取每一数值对应的问句;将每一数值对应的问句和所述目标医疗文本输入问答模型中,得到每一数值对应的属性信息;其中,每一数值对应的属性信息为每一数值对应的问句的答案;所述问答模型,基于第一数量的其他类的第一样本文本、第一样本问句和第一样本问句对应的真实答案,以及第二数量的医疗类的第二样本文本、第二样本问句和第二样本问句对应的真实答案进行训练获取;所述第一数量大于第二数量。本发明实现在节约医疗类标注数据资源的同时,达到较好的数值抽取和属性信息抽取效果。

    基于小样本的医疗数值抽取和理解方法及装置

    公开(公告)号:CN114357144B

    公开(公告)日:2022-08-09

    申请号:CN202210221233.9

    申请日:2022-03-09

    Applicant: 北京大学

    Abstract: 本发明提供一种基于小样本的医疗数值抽取和理解方法及装置,该方法包括:基于正则化表达式,对目标医疗文本进行数值抽取;基于prompt函数,获取每一数值对应的问句;将每一数值对应的问句和所述目标医疗文本输入问答模型中,得到每一数值对应的属性信息;其中,每一数值对应的属性信息为每一数值对应的问句的答案;所述问答模型,基于第一数量的其他类的第一样本文本、第一样本问句和第一样本问句对应的真实答案,以及第二数量的医疗类的第二样本文本、第二样本问句和第二样本问句对应的真实答案进行训练获取;所述第一数量大于第二数量。本发明实现在节约医疗类标注数据资源的同时,达到较好的数值抽取和属性信息抽取效果。

Patent Agency Ranking