基于多维特征的互联网网站综合分类方法

    公开(公告)号:CN108256104A

    公开(公告)日:2018-07-06

    申请号:CN201810112942.7

    申请日:2018-02-05

    Abstract: 本发明公开了一种基于多维特征的互联网网站综合分类方法,该方法包括:采集互联网网站域名信息,获得互联网网站的域名信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站标题信息,获取互联网网站的标题信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站首页信息,获取互联网网站的首页信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站页面链接信息,获取互联网网站的链接信息列表;综合获取的上述各信息列表,通过信息关联和机器学习,判别网站所属行业属性并进行对应分类。本发明解决了现有技术中无法对网站进行精确归类的问题。

    应用程序预测模型的建立方法、装置、存储介质及终端

    公开(公告)号:CN111258593B

    公开(公告)日:2023-10-27

    申请号:CN202010017418.9

    申请日:2020-01-08

    Abstract: 本发明实施例公开了一种应用程序预测模型的建立方法、装置、存储介质及终端。所述方法包括:获取第一预设时间段内至少两个用户的应用程序使用序列;根据所述应用程序使用序列生成用户长期兴趣向量和用户动态兴趣向量;根据所述用户长期兴趣向量和所述用户动态兴趣向量,对预设机器学习模型进行训练,生成应用程序预测模型。通过采用上述技术方案,优化了现有的应用程序预加载机制,通过能够真实反映用户行为的应用程序使用序列构建用户长期兴趣向量和用户动态兴趣向量,实现了应用程序使用序列与应用程序预测模型间的计算的解耦,提高了基于应用程序预测模型对预加载应用程序预测时的泛化力,同时有效的提高了对待启动应用程序预测的准确性。

    一种社交圈的确定方法、装置、设备和存储介质

    公开(公告)号:CN114612256A

    公开(公告)日:2022-06-10

    申请号:CN202210239169.7

    申请日:2022-03-11

    Abstract: 本发明实施例公开了一种社交圈的确定方法、装置、设备及存储介质。方法包括:根据用户通话记录信息确定可信社区以及用户活跃位置列表,其中,可信社区包含每一个用户之间的通话关联关系,用户活跃位置列表包含每一个用户的活跃位置信息;通过活跃位置列表对每一个可信社区进行分割,获取不同类型的社交圈。通过用户通话记录信息来确定可信社区以及用户活跃位置列表,由于活跃位置列表中包含行为信息即用户通话时所处于的位置,因此通过活跃位置列表来对每一个可信社区进行分割,使得所获取的社交圈的类型更加精准,因此根据所获取的社交圈能够提高安全预警能力,从而实现对用户的有效保护。

    位置预测方法、装置、存储介质及终端

    公开(公告)号:CN110944295A

    公开(公告)日:2020-03-31

    申请号:CN201911181313.0

    申请日:2019-11-27

    Abstract: 本发明实施例公开了一种位置预测方法、装置、存储介质及终端。所述方法包括:检测到位置预测事件被触发时,获取用户的当前位置序列;将所述当前位置序列输入至位置预测模型中,其中,所述位置预测模型包括根据样本位置序列对至少两个预设网络模型进行学习生成的混合网络模型;根据所述位置预测模型的输出结果预测出所述用户即将到达的位置。通过采用上述技术方案,不仅解决了现有的位置预测时间复杂度高的技术问题,而且通过采用混合网络模型,有效提高了对用户位置预测的准确性和效率。

    一种基于AI的跨设备上网用户识别方法

    公开(公告)号:CN108830052A

    公开(公告)日:2018-11-16

    申请号:CN201810515929.6

    申请日:2018-05-25

    Abstract: 本发明公开了一种基于AI的跨设备上网用户识别方法,所述方法包括:提取不同屏下的每个用户上网的URL数据和时间戳数据,并针对每条数据添加该用户的身份id;分别统计该用户的上网意向特征、强识别URL特征及上网时间特征;根据统计完成的上述三个特征中的一种或者多种建立该用户的基础模型,并通过梯度增强回归树算法对上述每个特征进行权重训练,得到该用户最终的上网行为模型;通过形成的所述上网行为模型,识别出跨屏用户身份。本发明所述的基于AI的跨设备上网用户识别方法,统计与分析了上网意向、强识别url和上网时间等特征,通过使用多种构造特征对样本检测和学习,使用在线学习对识别错的样本加入训练集更新模型,保证了识别率和准确率。

    网站分类方法及系统
    29.
    发明公开

    公开(公告)号:CN107908757A

    公开(公告)日:2018-04-13

    申请号:CN201711167799.3

    申请日:2017-11-21

    Abstract: 本发明涉及网络技术领域,公开了一种网站分类方法及系统,所述方法包括步骤:将网页所含的各类信息分别训练形成各自对应的信息矩阵;将形成的多个信息矩阵拼接组成成输入层特征矩阵;提取上述输入层特征矩阵的列特征向量个数及特征向量维数,生成卷积层;将卷积得到的列向量最大值提出并池化处理,获得和卷积核维数相同的行向量,形成池化层;将池化层输出的向量添加softmax函数,形成全连接层。本发明极大提高了现有的网站分类的准确性。

Patent Agency Ranking