一种基于主被动数据的互联网接入网站数量的计算方法

    公开(公告)号:CN108880883A

    公开(公告)日:2018-11-23

    申请号:CN201810618363.X

    申请日:2018-06-15

    Abstract: 本发明公开了一种基于主被动数据的互联网接入网站数量的计算方法,所述方法包括:被动采集全国及各省互联网网站报备数据信息和IP地址报备信息,获得全国及各省互联网网站备案的域名信息、IP地址分布库;被动采集全国及各省活跃域名信息,获得全国及各省采集到的活跃域名信息;主动分布式采集以上两种方式采集的域名对应的网站信息,获得网站连接状态、标题、首页静态数据、接入IP地址信息;基于以上三类数据,通过数学建模,分析出全国及各省互联网网站的数量。本发明公开的统计方法能够在很大程度上反应全国互联网网站的总体数量情况、各省互联网网站的总体数量情况、所占比重情况,以及总体变化情况,具有较好的应用前景。

    基于多维特征的互联网网站综合分类方法

    公开(公告)号:CN108256104A

    公开(公告)日:2018-07-06

    申请号:CN201810112942.7

    申请日:2018-02-05

    Abstract: 本发明公开了一种基于多维特征的互联网网站综合分类方法,该方法包括:采集互联网网站域名信息,获得互联网网站的域名信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站标题信息,获取互联网网站的标题信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站首页信息,获取互联网网站的首页信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站页面链接信息,获取互联网网站的链接信息列表;综合获取的上述各信息列表,通过信息关联和机器学习,判别网站所属行业属性并进行对应分类。本发明解决了现有技术中无法对网站进行精确归类的问题。

    应用程序预测模型的建立方法、装置、存储介质及终端

    公开(公告)号:CN111258593B

    公开(公告)日:2023-10-27

    申请号:CN202010017418.9

    申请日:2020-01-08

    Abstract: 本发明实施例公开了一种应用程序预测模型的建立方法、装置、存储介质及终端。所述方法包括:获取第一预设时间段内至少两个用户的应用程序使用序列;根据所述应用程序使用序列生成用户长期兴趣向量和用户动态兴趣向量;根据所述用户长期兴趣向量和所述用户动态兴趣向量,对预设机器学习模型进行训练,生成应用程序预测模型。通过采用上述技术方案,优化了现有的应用程序预加载机制,通过能够真实反映用户行为的应用程序使用序列构建用户长期兴趣向量和用户动态兴趣向量,实现了应用程序使用序列与应用程序预测模型间的计算的解耦,提高了基于应用程序预测模型对预加载应用程序预测时的泛化力,同时有效的提高了对待启动应用程序预测的准确性。

    一种建立CDN厂家基础知识库的方法

    公开(公告)号:CN109165334B

    公开(公告)日:2022-05-27

    申请号:CN201811100278.0

    申请日:2018-09-20

    Abstract: 本发明公开了一种建立CDN厂商基础知识库的方法,该方法包括:通过爬虫,获得网站上所有CDN厂家信息;被动采集全国各个域名解析服务器的域名解析记录,获得所有的域名解析信息;针对所有的解析域名进行字典表比照、CNAME聚类、IP分散度判别等综合判定,获得CDN子网信息;针对CDN子网域名信息依据字典表关联、备案库查询、whois查询、人工判别等手段建立与CDN厂商的对应关系,并形成最终的CDN厂商的子网域名和加速节点IP地址基础知识库。本发明公开的方法能够较为全面地发现CDN厂商的加速节点,并建立CDN厂商子网域名、加速节点IP地址等基础知识库,从而为CDN业务的行业发展和有效管理提供一定的技术支撑。

    网页安全检测方法、装置、设备及介质

    公开(公告)号:CN112866279A

    公开(公告)日:2021-05-28

    申请号:CN202110166179.8

    申请日:2021-02-03

    Abstract: 本发明实施例公开了一种网页安全检测方法、装置、设备及介质。该方法包括:获取待检测网页流量,所述待检测网页流量中包括多个待检测网页;对所述待检测网页流量中的各待检测网页逐个进行流量检测,得到与每个所述待检测网页分别对应的访问日志;根据所述访问日志,生成与所述待检测网页流量对应的访问日志清单;根据所述访问日志清单确定未被安全检测过的多个目标检测网页,并对各目标检测网页进行网页安全检测。上述技术方案实现了对新增的未检测网页进行网页安全检测,节省了系统资源,并且提高了检测效率。

Patent Agency Ranking