-
公开(公告)号:CN119886139A
公开(公告)日:2025-04-25
申请号:CN202411645805.1
申请日:2024-11-18
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/295 , G06F40/30 , G06F16/35 , G06F16/36 , G06N3/045 , G06N3/082 , G06N3/0442 , G06N3/047
Abstract: 本发明公开了一种CO2催化领域的多层次、广类别命名实体识别方法,其步骤包括:1)对关于CO2电催化还原的论文进行标注,得到一训练样本;2)生成训练样本的语义表示;3)将训练样本的语义表示输入实体识别模型,预测得到样本中每一实体的类型;根据预测结果和标注结果优化实体识别模型;4)根据设定的命名实体分类层级结构对各类型的实体进行细粒度标注,并将标注结果保存到数据字典中;5)对于一待处理论文,将该待处理论文的语义表示输入优化后的所述实体识别模型,预测得到该待处理论文中每一实体的类型;然后根据实体的类型在所述数据字典中查找匹配的细粒度类型,得到该待处理论文中每一实体的细粒度类型识别结果。