一种数据处理方法及相关设备
    1.
    发明公开

    公开(公告)号:CN118467744A

    公开(公告)日:2024-08-09

    申请号:CN202310067484.0

    申请日:2023-02-02

    Abstract: 本申请实施例提供了一种数据处理方法,可以应用于知识图谱构建等场景。该方法包括:获取文本数据;基于采样矩阵确定文本数据中的多个片段;确定多个片段的多个实体信息,每个实体信息包括第一实体的实体边界信息以及第一实体的类型;基于多个实体信息生成文本数据的多个第二实体。通过采样矩阵确定文本数据的多个片段,并预测出片段的实体信息,进而基于实体信息生成文本数据的第二实体。实体识别过程细化为片段的实体预测与第二实体的生成,相较于整个文本数据的实体生成,可以实现更细粒度的实体生成。

    一种文本分类方法以及相关设备
    2.
    发明公开

    公开(公告)号:CN118394931A

    公开(公告)日:2024-07-26

    申请号:CN202310064093.3

    申请日:2023-01-19

    Abstract: 本申请公开了一种文本分类方法,该方法中,通过神经网络中的多个信息提取子网络,获得文本数据的多个尺度的文本特征,并通过每个信息提取子网络,获得多个预设类别标签中,每个预设类别标签与每个相应尺度的文本特征之间的相关性信息,从而根据每个信息提取子网络获得的相关性信息,获得文本数据的分类结果。这样,在确定该文本数据对应的目标类别之后,则可以根据每个信息提取子网络获得的相关性信息,从多个尺度的文本特征中确定出与该目标类别的相关性较高的文本特征,从而可以确定出文本数据中与该目标类别相关度较高的文本内容以作为该目标类别的推理依据,从而实现对文本数据的分类结果的解释,提升神经网络的推理结果的可解释性。

Patent Agency Ranking