-
公开(公告)号:CN118467744A
公开(公告)日:2024-08-09
申请号:CN202310067484.0
申请日:2023-02-02
Applicant: 华为云计算技术有限公司
IPC: G06F16/36
Abstract: 本申请实施例提供了一种数据处理方法,可以应用于知识图谱构建等场景。该方法包括:获取文本数据;基于采样矩阵确定文本数据中的多个片段;确定多个片段的多个实体信息,每个实体信息包括第一实体的实体边界信息以及第一实体的类型;基于多个实体信息生成文本数据的多个第二实体。通过采样矩阵确定文本数据的多个片段,并预测出片段的实体信息,进而基于实体信息生成文本数据的第二实体。实体识别过程细化为片段的实体预测与第二实体的生成,相较于整个文本数据的实体生成,可以实现更细粒度的实体生成。