网站内容下载方法和装置
    311.
    发明公开

    公开(公告)号:CN102135970A

    公开(公告)日:2011-07-27

    申请号:CN201010105103.6

    申请日:2010-01-26

    Abstract: 本发明公开了一种网站内容下载方法和装置,其中该网站内容下载方法包括以下步骤:下载请求接收步骤,用于接收用户的网站内容下载请求;模板检查步骤,用于检查是否存在适于网站内容下载请求的现有模板,其中所述模板包含待下载网站内容的标识信息;模板创建步骤,用于如果不存在现有模板,则通过向用户提供模板设计向导来创建新模板;内容下载步骤,用于使用现有模板或新模板来下载网站内容。根据本发明的技术方案,能够为用户提供通用的网站内容下载服务。

    字符识别方法和字符识别装置

    公开(公告)号:CN102024138A

    公开(公告)日:2011-04-20

    申请号:CN200910173692.9

    申请日:2009-09-15

    Abstract: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。

    生成或显示网页标注的方法和装置以及信息共享系统

    公开(公告)号:CN101866342A

    公开(公告)日:2010-10-20

    申请号:CN200910133976.5

    申请日:2009-04-16

    Inventor: 郝宇 孟遥 于浩

    Abstract: 公开了一种用于生成或显示网页标注的方法和装置,以及基于这种网页标注的信息共享系统。生成网页标注信息的方法,包括:响应于用户在客户端Web浏览器上载入的当前网页上选择了目标网页元素作为被标注对象,提取被标注对象在当前网页的文档对象模型(DOM)树中的XPath路径;基于被标注对象及当前网页中紧邻在被标注对象之前和之后的上下文网页元素的内容,生成被标注对象的特征码CF;以及基于被标注对象的XPath路径、特征码CF以及用户输入的标注,生成网页标注信息,其中,网页标注信息被存储在远程标注服务器的标注数据库中,被标注对象的特征码CF由被标注对象的基于内容的特征(CBF)及其上下文网页元素的CBF构成。

    地名搜索装置和系统

    公开(公告)号:CN101840406A

    公开(公告)日:2010-09-22

    申请号:CN200910129465.6

    申请日:2009-03-20

    Abstract: 提供一种地名搜索装置包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。这种地名搜索装置可提高地名搜索处理的效率和准确性。还提供一种地名搜索方法。

    信息提取方法和装置

    公开(公告)号:CN101833555A

    公开(公告)日:2010-09-15

    申请号:CN200910127243.0

    申请日:2009-03-12

    Abstract: 本发明涉及信息提取方法和装置。用于从输入的信息源中提取涉及特定主题的有用信息的信息提取方法,包括:基于描述了各类训练语素的组合概率的分类模板,从所述信息源中定位感兴趣的各类目标语素;按照预定的匹配规则对所述定位的各类目标语素进行匹配,并提取符合所述预定匹配规则的目标语素以组合成描述向量;以及基于所述提取出的描述向量,生成全局性信息以作为所述涉及特定主题的有用信息。

Patent Agency Ranking