-
公开(公告)号:CN111125584B
公开(公告)日:2023-06-06
申请号:CN201911337778.0
申请日:2019-12-23
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/957 , G06F16/955 , G06F16/9032 , G06Q30/0207
Abstract: 本申请公开了一种基于舆情分析的消费返利平台识别方法、装置、设备及可读存储介质,包括:利用jsoup请求URL,获取html页面数据;利用xpath节点解析html页面数据,得到页面内容;根据已知的消费返利平台样本和非消费返利平台样本,利用LOF算法对页面内容中的舆情信息进行分析,得到当前平台的识别结果,以确定当前平台是否为消费返利平台。可见,本申请能够自动采集平台页面数据,并通过智能分析页面内容中的舆情信息,判别当前平台是否为消费返利平台,是一种自动化识别消费返利平台的方案,避免了人工识别费时费力的问题,提升了消费返利平台的识别效率。
-
公开(公告)号:CN111125584A
公开(公告)日:2020-05-08
申请号:CN201911337778.0
申请日:2019-12-23
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/957 , G06F16/955 , G06F16/9032 , G06Q30/02
Abstract: 本申请公开了一种基于舆情分析的消费返利平台识别方法、装置、设备及可读存储介质,包括:利用jsoup请求URL,获取html页面数据;利用xpath节点解析html页面数据,得到页面内容;根据已知的消费返利平台样本和非消费返利平台样本,利用LOF算法对页面内容中的舆情信息进行分析,得到当前平台的识别结果,以确定当前平台是否为消费返利平台。可见,本申请能够自动采集平台页面数据,并通过智能分析页面内容中的舆情信息,判别当前平台是否为消费返利平台,是一种自动化识别消费返利平台的方案,避免了人工识别费时费力的问题,提升了消费返利平台的识别效率。
-