一种中文变异文本匹配识别方法

    公开(公告)号:CN101976253A

    公开(公告)日:2011-02-16

    申请号:CN201010521160.2

    申请日:2010-10-27

    Abstract: 一种中文变异文本匹配识别方法,该方法通过将目标文本和模式字符串进行特殊的编码转换以提高文本的相似度,并根据模式字符串中汉字字符结构特征对转换后的模式字符串添加适当的通配符,然后采用精确字符串匹配算法(即CV-BM算法)进行匹配。解决了变异文本中形近字替换及基于形近错别字替换的难以匹配的问题。能够解决形近字替换及基于形近错别字替换的文本变异难以匹配的情况,较图像分割识别方法有着更小的时间和空间复杂度,更适宜于高速网络数据传输环境中的中文信息快速匹配,可以广泛的应用于需要对中文信息进行匹配的入侵防御系统、信息检索等系统中。

    一种中文变异文本匹配识别方法

    公开(公告)号:CN101976253B

    公开(公告)日:2013-03-06

    申请号:CN201010521160.2

    申请日:2010-10-27

    Abstract: 一种中文变异文本匹配识别方法,该方法通过将目标文本和模式字符串进行特殊的编码转换以提高文本的相似度,并根据模式字符串中汉字字符结构特征对转换后的模式字符串添加适当的通配符,然后采用精确字符串匹配算法(即CV-BM算法)进行匹配。解决了变异文本中形近字替换及基于形近错别字替换的难以匹配的问题。能够解决形近字替换及基于形近错别字替换的文本变异难以匹配的情况,较图像分割识别方法有着更小的时间和空间复杂度,更适宜于高速网络数据传输环境中的中文信息快速匹配,可以广泛的应用于需要对中文信息进行匹配的入侵防御系统、信息检索等系统中。

Patent Agency Ranking