多状态AJAX网页内容获取方法及系统

    公开(公告)号:CN102609518A

    公开(公告)日:2012-07-25

    申请号:CN201210028947.4

    申请日:2012-02-09

    Applicant: 清华大学

    Abstract: 本发明是一种多状态AJAX网页内容自动获取方法和系统,属于互联网数据挖掘技术领域。该方法包括:加载网页并提取AJAX调用事件,按照基于AJAX状态转换图的遍历方法逐步执行所有AJAX调用事件,并用AJAX状态识别方法判断每次执行得到的状态是否是重复状态,从而自动获取多状态AJAX网页所有状态内容和状态转换信息。与所述方法相对应的系统包括:事件识别和执行单元、页面状态识别单元和状态遍历调度单元。通过本发明能获取到多状态AJAX网页内容和状态转换信息,使搜索引擎能够索引更完整的网页内容。

    可移植的网络信息共享方法

    公开(公告)号:CN101291304B

    公开(公告)日:2011-02-02

    申请号:CN200810114914.5

    申请日:2008-06-13

    Applicant: 清华大学

    Abstract: 可移植的网络信息共享方法,属于信息共享技术领域。该方法包括共享信息获取方法;共享信息解析方法;共享信息同步及发布方法。本发明提供两种共享信息获取方法;两种共享信息解析方法和3种共享信息同步及发布方法。本发明还提供一种可移植的网络信息共享结构,该结构共享信息获取服务器通过共享信息获取方法从原始内容服务器有选择性地获取信息;将它们进行解析、按格式存储;共享信息镜像服务器从共享信息解析服务器获取共享信息为终端用户提供服务。本发明能够将互联网上的共享信息自由移植并同步至其它通信系统,为终端用户提供一跳获取的便捷、实时信息服务。方法及结构经实验验证取得良好的效果。所述方法、结构及模式被命名为4ANet。

    可移植的网络信息共享方法

    公开(公告)号:CN101291304A

    公开(公告)日:2008-10-22

    申请号:CN200810114914.5

    申请日:2008-06-13

    Applicant: 清华大学

    Abstract: 可移植的网络信息共享方法,属于信息共享技术领域。该方法包括共享信息获取方法;共享信息解析方法;共享信息同步及发布方法。本发明提供两种共享信息获取方法;两种共享信息解析方法和3种共享信息同步及发布方法。本发明还提供一种可移植的网络信息共享结构,该结构共享信息获取服务器通过共享信息获取方法从原始内容服务器有选择性地获取信息;将它们进行解析、按格式存储;共享信息镜像服务器从共享信息解析服务器获取共享信息为终端用户提供服务。本发明能够将互联网上的共享信息自由移植并同步至其它通信系统,为终端用户提供一跳获取的便捷、实时信息服务。方法及结构经实验验证取得良好的效果。所述方法、结构及模式被命名为4ANet。

    多状态AJAX网页内容获取方法及系统

    公开(公告)号:CN102609518B

    公开(公告)日:2015-02-18

    申请号:CN201210028947.4

    申请日:2012-02-09

    Applicant: 清华大学

    Abstract: 本发明是一种多状态AJAX网页内容自动获取方法和系统,属于互联网数据挖掘技术领域。该方法包括:加载网页并提取AJAX调用事件,按照基于AJAX状态转换图的遍历方法逐步执行所有AJAX调用事件,并用AJAX状态识别方法判断每次执行得到的状态是否是重复状态,从而自动获取多状态AJAX网页所有状态内容和状态转换信息。与所述方法相对应的系统包括:事件识别和执行单元、页面状态识别单元和状态遍历调度单元。通过本发明能获取到多状态AJAX网页内容和状态转换信息,使搜索引擎能够索引更完整的网页内容。

Patent Agency Ranking