用以检测新的领域知识的基于深度学习的自动本体抽取

    公开(公告)号:CN114722190A

    公开(公告)日:2022-07-08

    申请号:CN202111541786.4

    申请日:2021-12-16

    Abstract: 本发明涉及用以检测新的领域知识的基于深度学习的自动本体抽取。一种系统,其处理非结构化数据以识别在该非结构化数据中的文本集中的文本中的多个子集,并且针对来自所述多个子集中的一个子集,基于该子集在文本集中的位置、该子集中每个词的词性(POS)、以及在该子集的左手侧和右手侧上的一个或多个词的POS来确定概率,所述一个或多个词的数量是基于文本集的长度来选择的。系统生成该子集的特征向量,该特征向量包括概率和子集的附加特征;并且使用分类器基于该子集的特征向量将该子集分类到多个类中的一个中,所述多个类表示知识的领域的本体。

Patent Agency Ranking