-
公开(公告)号:CN104699662B
公开(公告)日:2017-12-22
申请号:CN201510120020.7
申请日:2015-03-18
Applicant: 北京交通大学
Abstract: 本发明公开了一种识别整体符号串的方法和装置,属于自然语言处理研究领域。所述方法包括:提取文本信息中包含的符号串;从所述符号串中获取具有对称性的符号对;根据所述获取的符号对计算所述符号串的对称度;如果所述符号串的对称度满足预设条件,则确定所述符号串为整体符号串。所述装置包括:提取模块,获取模块,计算模块和确定模块。由于本发明能够计算符号串的对称度,根据符号串的对称度确定符号串是否是整体符号串,不需要依赖表情符号字典,即使不在表情符号字典内的符号串,也能够确定出该符号串是否是整体符号串,从而解决了表情符号等符号串信息识别精度低下、容易造成文本信息缺失等问题,达到了提高文本信息处理系统的性能的效果。