-
公开(公告)号:CN110598115A
公开(公告)日:2019-12-20
申请号:CN201910884927.9
申请日:2019-09-18
Applicant: 北京市博汇科技股份有限公司
IPC: G06F16/9535 , G06F16/958 , G06F16/535 , G06F16/583
Abstract: 本发明提供了一种基于人工智能多引擎的敏感网页识别方法及系统,涉及页面识别的技术领域,能够在获取预先设定的业务属性标识时,根据业务属性标识构建引擎组合;基于引擎组合对待识别网页进行敏感识别,以确定待识别网页是否为敏感网页,利用多引擎对网页进行敏感识别,避免了人工核对存在的效率低下、监控不及时等问题。
-
公开(公告)号:CN115002068A
公开(公告)日:2022-09-02
申请号:CN202210499616.2
申请日:2022-05-09
Applicant: 北京市博汇科技股份有限公司
IPC: H04L61/103 , H04L67/02 , H04L67/51 , H04L67/60
Abstract: 本发明公开了一种互联网视听节目地址自动化解析方法及系统,基于服务对浏览器窗口进行编排,浏览器不限于开源或者闭源,不限制平台,驱动浏览器窗口并行加载节目,配合自研解析引擎,在浏览器窗口获取到对应节目请求的响应内容,将响应内容按照适配的规则进行解析,获取到节目视频的真实地址,通过引擎将真实地址回推给服务,服务将真实地址交由下载器进行下载。
-
公开(公告)号:CN114691861A
公开(公告)日:2022-07-01
申请号:CN202011576986.9
申请日:2020-12-28
Applicant: 北京市博汇科技股份有限公司
IPC: G06F16/35 , G06F40/194 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种基于主题词语义相似度的话题聚类方法,该方法对每个原始标题进行预处理,获取待聚类标题集合,然后提取目标待聚类标题对应的多个主题词,根据预设的排除词集合及每个待聚类标题对应的多个主题词,生成主题集合,对主题集合中的任一主题对象进行文本数字化处理,获取主题向量化集合,针对目标主题向量化对象,从主题向量化集合中筛选出相似的主题向量化对象,并将目标主题向量化对象与相似的主题向量化对象作为同种话题实现聚类。上述方法在针对大量网络文本数据时,不需要指定K值,通过提取主题词,然后计算相似度,便可以实现话题聚类,且能够保证聚类的主题相似,话题相近,具有覆盖范围大,计算复杂度低的优点。
-
-