从非字符子标记信号中自动检测语言

    公开(公告)号:CN116194925A

    公开(公告)日:2023-05-30

    申请号:CN202180063398.1

    申请日:2021-06-03

    Abstract: 在本公开的非限制性示例中,呈现了用于确定文本字符串的语言的系统、方法和设备。可以维护语言检测模型。语言检测模型可以包括针对词首辅音和词尾辅音的身份和权重,针对前缀和后缀的身份和权重,以及针对元音序列的身份和权重,其中每个身份都是从训练语料库中导出的。权重可以对应于文本单元在语料库中的频率。可以接收文本字符串,并且可以确定文本字符串与语言检测模型的语言之间的匹配分数。匹配分数可以基于针对文本字符串中每个单词的词首辅音分数和词尾辅音分数、前缀分数和后缀分数和/或元音序列分数。如果匹配分数满足阈值,则可以执行与该语言相关联的后续动作。

Patent Agency Ranking