文本结构化处理方法、装置、存储介质及计算机设备

    公开(公告)号:CN114266230A

    公开(公告)日:2022-04-01

    申请号:CN202111644937.9

    申请日:2021-12-30

    Abstract: 本申请公开了一种文本结构化处理方法、装置、存储介质及计算机设备。该方法包括:基于知识字典中的实体及实体类型,对待结构化处理的文本信息进行实体提取编码处理,得到文本信息中的各实体的实体编码特征,将文本信息对应的文本字符特征与实体编码特征进行拼接处理,得到包括文本字符特征和实体编码特征的特征集合,获取特征集合中各特征相对于文本信息的实体注意力权重,根据实体注意力权重,对文本信息进行编码得到文本信息所对应的文本编码特征,文本编码特征进行解码得到文本信息中的结构化信息。本申请可同时抽取文本信息中的关联关系和实体,消除了误差传播,增强了不同实体之间的信息交互,提高了文本结构化处理的准确性。

    一种症状信息抽取方法、装置、设备及存储介质

    公开(公告)号:CN112883194A

    公开(公告)日:2021-06-01

    申请号:CN202110367733.9

    申请日:2021-04-06

    Abstract: 本申请提供了一种症状信息抽取方法、装置、设备及存储介质,其中,方法包括:获取与待抽取症状信息的第一文本中的内容匹配的症状标准词,作为目标医学知识;将目标医学知识融入第一文本中,融入目标医学知识的文本作为第二文本;基于预先建立的症状信息抽取模型对第二文本进行症状信息的抽取,抽取出的症状信息作为第一文本对应的症状信息抽取结果。经由本申请提供的症状信息抽取方法可从待抽取症状信息的病情文本中抽取出标准的症状描述信息。

Patent Agency Ranking