-
公开(公告)号:CN115438660A
公开(公告)日:2022-12-06
申请号:CN202211117850.0
申请日:2022-09-14
Applicant: 北京邮电大学
IPC: G06F40/284 , G06F40/157 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种中文歧义非标准词的识别与转化系统,包括如下模块:非标准词检测模块、歧义非标准词分类模块和非标准词规则转化模块;一种中文歧义非标准词的识别与转化方法,包括下列操作步骤:(1)将待检测文本输入到非标准词检测模块,输出所有的非标准词成分;(2)把没有歧义的非标准词输入到非标准词规则转化模块,转化为标准中文;(3)把有歧义的非标准词输入到歧义非标准词分类模块进行歧义类型的分类;(4)将该歧义非标准词及其歧义类型输入到非标准词规则转化模块,转化为标准中文。