对尚未访问的网页进行基于路径的排队的方法和系统

    公开(公告)号:CN1186737C

    公开(公告)日:2005-01-26

    申请号:CN02103529.6

    申请日:2002-02-05

    Inventor: 苏辉 潘越 马小川

    Abstract: 本发明提供一种在万维网爬行处理过程中对尚未访问的网页进行基于路径的排队的方法和系统。本发明将所有从“种子”URL开始通向已访问的相关网页的路径标识为“优选路径集”,并且将从“种子”URL开始通向尚未访问网页的路径标识为“部分路径集”,对所有已访问的网页进行分类,并且用每个网页所属的类别来标识该网页;训练-统计模型,用于表征“优选路径集”中所有路径的共同路径模式;以及,使用所述统计模型对“部分路径集”进行评估,并且使用评估结果对所有尚未访问的网页进行排队。

    手写汉字自动分割和识别方法以及使用该方法的系统

    公开(公告)号:CN1260524A

    公开(公告)日:2000-07-19

    申请号:CN99100938.X

    申请日:1999-01-13

    CPC classification number: G06K9/68

    Abstract: 本发明公开了一种在手写汉字信息处理系统中自动分割和识别用户连续输入的手写汉字串的方法,包括以下步骤:建立几何模型和语言模型;基于相关时序信息和几何模型找出连续输入的手写汉字串中所有的潜在分割方案;对于每一种分割方案,对任意两个分割点之间的笔画组进行识别,并计算出表征识别结果正确性的概率;用语言模型修正上述表征识别结果正确性的概率;和,选择对应于概率值最大的识别结果和该识别结果所对应的分割方案。

    手写汉字识别方法及装置

    公开(公告)号:CN1232204A

    公开(公告)日:1999-10-20

    申请号:CN98106953.3

    申请日:1998-04-16

    CPC classification number: G06K9/00429

    Abstract: 基于笔划识别的手写汉字识别方法,包括以下步骤:识别手写笔划,更新笔划代码序列;在字典/词典中,检索至少一个相应的字典/词典条目,获得至少一个候选汉字/词组;动态显示至少一个候选汉字/词组;如果判断出用户继续写下一个笔划,则转移到笔划识别步骤;将用户从所显示的候选汉字/词组中选择的一个候选汉字/词组作为手写输入的汉字/词组输入到计算机中。

Patent Agency Ranking