-
公开(公告)号:CN108256104A
公开(公告)日:2018-07-06
申请号:CN201810112942.7
申请日:2018-02-05
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明公开了一种基于多维特征的互联网网站综合分类方法,该方法包括:采集互联网网站域名信息,获得互联网网站的域名信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站标题信息,获取互联网网站的标题信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站首页信息,获取互联网网站的首页信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站页面链接信息,获取互联网网站的链接信息列表;综合获取的上述各信息列表,通过信息关联和机器学习,判别网站所属行业属性并进行对应分类。本发明解决了现有技术中无法对网站进行精确归类的问题。
-
公开(公告)号:CN112948209B
公开(公告)日:2024-11-29
申请号:CN202110213478.2
申请日:2021-02-25
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明实施例公开了一种应用程序使用结果生成方法、装置、电子设备及存储介质。该方法包括:获取用户在使用终端过程中所产生的总网络数据;其中,所述总网络数据包括至少一个特征参数和应用程序使用属性;若所述应用程序使用属性包括预设属性,则分析所述总网络数据中的所述至少一个特征参数的数值;根据所述至少一个特征参数的数值,确定终值超出阈值的应用程序;其中,所述终值为所述数值的加权和;将所述应用程序的使用结果进行统计,并生成所述使用结果至终端。采用上述技术手段能够实现提高判断应用程序使用时长的准确度的目的。
-
公开(公告)号:CN118964841A
公开(公告)日:2024-11-15
申请号:CN202410979874.X
申请日:2024-07-19
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06F18/10 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本公开提供了一种信息检测方法及电子设备,所述方法包括响应于确定信息数据满足预设条件,获取信息数据;采用预设数据库或多个精调模型对所述信息数据进行信息情感判定,得到所述信息数据的情感标签及所述情感标签对应的情感分值;根据所述情感分值确定所述信息数据的检测结果。本申请通过对信息数据进行多个精调模型的判定,得到信息数据的情感标签及所述情感标签对应的情感分值,从而得到检测结果,通过本申请得到检测结果更加精确且通过模型自动得到结果无需人工研判。
-
公开(公告)号:CN111258593B
公开(公告)日:2023-10-27
申请号:CN202010017418.9
申请日:2020-01-08
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06F9/445 , G06F16/9535 , G06N3/0442 , G06N3/08
Abstract: 本发明实施例公开了一种应用程序预测模型的建立方法、装置、存储介质及终端。所述方法包括:获取第一预设时间段内至少两个用户的应用程序使用序列;根据所述应用程序使用序列生成用户长期兴趣向量和用户动态兴趣向量;根据所述用户长期兴趣向量和所述用户动态兴趣向量,对预设机器学习模型进行训练,生成应用程序预测模型。通过采用上述技术方案,优化了现有的应用程序预加载机制,通过能够真实反映用户行为的应用程序使用序列构建用户长期兴趣向量和用户动态兴趣向量,实现了应用程序使用序列与应用程序预测模型间的计算的解耦,提高了基于应用程序预测模型对预加载应用程序预测时的泛化力,同时有效的提高了对待启动应用程序预测的准确性。
-
公开(公告)号:CN114612256A
公开(公告)日:2022-06-10
申请号:CN202210239169.7
申请日:2022-03-11
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06Q50/00 , H04L51/222 , H04L51/52
Abstract: 本发明实施例公开了一种社交圈的确定方法、装置、设备及存储介质。方法包括:根据用户通话记录信息确定可信社区以及用户活跃位置列表,其中,可信社区包含每一个用户之间的通话关联关系,用户活跃位置列表包含每一个用户的活跃位置信息;通过活跃位置列表对每一个可信社区进行分割,获取不同类型的社交圈。通过用户通话记录信息来确定可信社区以及用户活跃位置列表,由于活跃位置列表中包含行为信息即用户通话时所处于的位置,因此通过活跃位置列表来对每一个可信社区进行分割,使得所获取的社交圈的类型更加精准,因此根据所获取的社交圈能够提高安全预警能力,从而实现对用户的有效保护。
-
公开(公告)号:CN107908757B
公开(公告)日:2020-05-26
申请号:CN201711167799.3
申请日:2017-11-21
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06F16/958 , G06F16/955 , G06F16/35 , G06F40/279 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及网络技术领域,公开了一种网站分类方法及系统,所述方法包括步骤:将网页所含的各类信息分别训练形成各自对应的信息矩阵;将形成的多个信息矩阵拼接组成成输入层特征矩阵;提取上述输入层特征矩阵的列特征向量个数及特征向量维数,生成卷积层;将卷积得到的列向量最大值提出并池化处理,获得和卷积核维数相同的行向量,形成池化层;将池化层输出的向量添加softmax函数,形成全连接层。本发明极大提高了现有的网站分类的准确性。
-
公开(公告)号:CN110944295A
公开(公告)日:2020-03-31
申请号:CN201911181313.0
申请日:2019-11-27
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明实施例公开了一种位置预测方法、装置、存储介质及终端。所述方法包括:检测到位置预测事件被触发时,获取用户的当前位置序列;将所述当前位置序列输入至位置预测模型中,其中,所述位置预测模型包括根据样本位置序列对至少两个预设网络模型进行学习生成的混合网络模型;根据所述位置预测模型的输出结果预测出所述用户即将到达的位置。通过采用上述技术方案,不仅解决了现有的位置预测时间复杂度高的技术问题,而且通过采用混合网络模型,有效提高了对用户位置预测的准确性和效率。
-
公开(公告)号:CN108830052A
公开(公告)日:2018-11-16
申请号:CN201810515929.6
申请日:2018-05-25
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明公开了一种基于AI的跨设备上网用户识别方法,所述方法包括:提取不同屏下的每个用户上网的URL数据和时间戳数据,并针对每条数据添加该用户的身份id;分别统计该用户的上网意向特征、强识别URL特征及上网时间特征;根据统计完成的上述三个特征中的一种或者多种建立该用户的基础模型,并通过梯度增强回归树算法对上述每个特征进行权重训练,得到该用户最终的上网行为模型;通过形成的所述上网行为模型,识别出跨屏用户身份。本发明所述的基于AI的跨设备上网用户识别方法,统计与分析了上网意向、强识别url和上网时间等特征,通过使用多种构造特征对样本检测和学习,使用在线学习对识别错的样本加入训练集更新模型,保证了识别率和准确率。
-
公开(公告)号:CN107908757A
公开(公告)日:2018-04-13
申请号:CN201711167799.3
申请日:2017-11-21
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明涉及网络技术领域,公开了一种网站分类方法及系统,所述方法包括步骤:将网页所含的各类信息分别训练形成各自对应的信息矩阵;将形成的多个信息矩阵拼接组成成输入层特征矩阵;提取上述输入层特征矩阵的列特征向量个数及特征向量维数,生成卷积层;将卷积得到的列向量最大值提出并池化处理,获得和卷积核维数相同的行向量,形成池化层;将池化层输出的向量添加softmax函数,形成全连接层。本发明极大提高了现有的网站分类的准确性。
-
-
-
-
-
-
-
-