生物医学文献类型判定方法及装置

    公开(公告)号:CN114706971A

    公开(公告)日:2022-07-05

    申请号:CN202210254033.3

    申请日:2022-03-15

    Abstract: 本发明提供一种生物医学文献类型判定方法及装置,方法包括:获取待判定的生物医学文献;利用预先构建的判定规则对生物医学文献进行规则判定,得到文献类型判定结果;基于文献类型判定结果为无,将相应待判定的生物医学文献的题目及摘要输入至文献类型判定模型中,得到文献类型判定模型输出的文献判定类型;其中,文献类型判定模型是基于待学习文献及其对应的训练标注数据训练得到的;文献类型判定模型用于基于对待判定文献的题目及摘要提取的标题文本特征和摘要文本特征进行拼接并预测,得到文献判定类型。本发明利用判定规则对生物医学文献进行判定,以排除无关的文献类型,大幅度缩短文献筛选的时间,进而便于模型快速准确的获取文献类型。

    一种文本处理方法及设备
    4.
    发明公开

    公开(公告)号:CN115422324A

    公开(公告)日:2022-12-02

    申请号:CN202211020195.7

    申请日:2022-08-24

    Abstract: 本发明提供一种文本处理方法及设备,可以获得文献关键词生成模型;其中,文献关键词生成模型是基于模型处理方式生成的,模型处理方式至少包括训练方式,训练方式是基于提示学习范式生成的至少一个训练样本,对预训练语言模型进行训练的;获得目标文献的摘要文本和题目文本;将目标文献的摘要文本和题目文本输入至文献关键词生成模型中;获得由文献关键词生成模型生成并输出的目标文献的至少一个文献关键词。本发明可以获得具备预测和生成文献关键词能力的文献关键词生成模型,通过使用文献关键词生成模型,来预测和生成目标文献的文献关键词,无需通过人工提取的处理方式来从文献中提取出文献关键词,可以有效提高文献关键词的生成效率。

    基于自然语言处理的数量提取方法和系统

    公开(公告)号:CN114707491A

    公开(公告)日:2022-07-05

    申请号:CN202210254037.1

    申请日:2022-03-15

    Abstract: 本发明涉及自然语言处理技术领域,提供一种基于自然语言处理的数量提取方法和系统。其中方法包括:获取包括数量的自然语言文本;基于自然语言文本运行数量提取模型,得到数量结果;数量提取模型的输入包括第一前缀语句、第一后缀语句以及自然语言文本,输出包括第二后缀语句。本发明通过将原始模型经过无监督的第一训练得到的中间模型具有更好的自然语言理解能力,中间模型经过有监督的第二训练得到的数量提取模型具有更好的数量提取能力,解决了现有技术中无法针对特定待提取目标和类型进行数量提取的问题,能够更为高效的完成数量提取任务。

Patent Agency Ranking