文本处理、同形异码字确定方法、装置和设备

    公开(公告)号:CN116227432A

    公开(公告)日:2023-06-06

    申请号:CN202310199456.4

    申请日:2023-02-24

    Abstract: 本说明书实施例公开了一种文本处理、同形异码字确定方法、装置和设备,所述文本处理方法可在获取待处理文本后,针对所述待处理文本中的第一字符,确定目标字符集中是否包含所述第一字符,其中,所述第一字符为所述待处理文本中的任一字符,所述目标字符集中的字符能够被后续文本处理任务正确处理;在所述目标字符集中不包含所述第一字符的情况下,确定所述目标字符集中是否存在第二字符,其中,所述第二字符为所述第一字符在所述目标字符集中的同形异码字;在所述目标字符集中存在所述第二字符的情况下,将所述待处理文本中的所述第一字符替换为所述第二字符。

    文本处理方法以及装置
    5.
    发明公开

    公开(公告)号:CN116483965A

    公开(公告)日:2023-07-25

    申请号:CN202310401259.6

    申请日:2023-04-14

    Abstract: 本说明书实施例提供文本处理方法以及装置,其中所述文本处理方法包括:根据目标事件对应的业务文本生成文本片段,并将所述文本片段输入至文本处理模型,其中,所述文本处理模型包括初始化单元、提取单元、交换单元以及处理单元;针对所述文本片段添加标识信息,并通过所述初始化单元对添加所述标识信息的文本片段进行初始化处理,获得中间片段特征;通过所述提取单元提取所述中间片段特征的目标特征,并通过所述交换单元对所述目标特征中的目标标识信息进行信息交换处理,根据处理结果确定目标片段特征;通过所述处理单元对所述目标片段特征进行处理,获得所述目标事件的事件决策信息。

Patent Agency Ranking