中文分词方法、装置及设备
    3.
    发明公开

    公开(公告)号:CN116205223A

    公开(公告)日:2023-06-02

    申请号:CN202211728809.7

    申请日:2022-12-30

    Abstract: 本发明实施例提供一种中文分词方法、装置及设备,该方法包括:获取待分词的DR报告;对DR报告中的文本进行字嵌入处理,获得文本中每个字所对应的字向量;确定文本中各个字向量之间的关联关系;基于关联关系,对文本进行分词处理,获得多个分词标签以及多个分词标签各自对应的概率;根据多个分词标签以及多个分词标签各自对应的概率,确定待分词的DR报告的分词结果。在上述方案中,通过DR报告中各个字向量之间的关联关系,对DR报告中的文本进行多种形式的分词,获得多个分词标签以及多个分词标签各自对应的概率,并基于多个分词标签以及多个分词标签各自对应的概率,确定待分词的DR报告的最终分词结果,实现了对DR报告的精准分词。

Patent Agency Ranking