-
公开(公告)号:CN109951739B
公开(公告)日:2021-06-08
申请号:CN201910241011.1
申请日:2019-03-27
Applicant: 北京市博汇科技股份有限公司
IPC: H04N21/442 , H04N21/24 , H04N21/258 , H04N17/00 , G06F16/17
Abstract: 本申请提供一种视频业务处理方法、装置及电子设备。方法包括:基于预设的视频业务获取与所述视频业务对应的爬虫任务集及配置文件;基于所述配置文件为所述爬虫任务集中的爬虫任务分配账号和进程,所述配置文件记录所述爬虫任务集中的每个爬虫任务对应的账号和进程,其中,所述爬虫任务集中的不同的第一爬虫任务对应的第一账号不相同,所述第一爬虫任务为需要重复登录账号的任务,每个所述第一账号与一个爬虫任务对应,且与所述第一账号对应的爬虫任务为所述第一爬虫任务;根据为所述爬虫任务集中的爬虫任务分配的账号和进程执行所述爬虫任务集中的爬虫任务,能够改善因采集数据速率低导致视频业务监测的效率低的技术问题。
-
公开(公告)号:CN110275958B
公开(公告)日:2021-07-27
申请号:CN201910565890.3
申请日:2019-06-26
Applicant: 北京市博汇科技股份有限公司
IPC: G06F16/35 , G06F16/332 , G06F16/9532 , G06F16/958
Abstract: 本发明提供了一种网站信息识别方法、装置和电子设备,其中,该方法包括:根据目标网站的地址获取目标网站的内容;内容包括:文本内容、图片文件和展示效果截图;根据预设的敏感违规词库对文本内容进行精确匹配和/或自然语言分析处理,确定出目标网站的文本识别结果;根据预设的带有不同类型标签的样本图片对图片文件和展示效果截图分别进行基于深度学习的图像分类识别,确定出目标网站的图片识别结果。本发明在获取目标网站的内容后,对文本内容进行精确匹配和/或自然语言分析处理以获得文本识别结果;对图片文件和展示效果截图进行深度学习以获得图片识别结果。可以有效地判断该网站是否存在不良内容,减少误判率。
-
公开(公告)号:CN110275958A
公开(公告)日:2019-09-24
申请号:CN201910565890.3
申请日:2019-06-26
Applicant: 北京市博汇科技股份有限公司
IPC: G06F16/35 , G06F16/332 , G06F16/9532 , G06F16/958
Abstract: 本发明提供了一种网站信息识别方法、装置和电子设备,其中,该方法包括:根据目标网站的地址获取目标网站的内容;内容包括:文本内容、图片文件和展示效果截图;根据预设的敏感违规词库对文本内容进行精确匹配和/或自然语言分析处理,确定出目标网站的文本识别结果;根据预设的带有不同类型标签的样本图片对图片文件和展示效果截图分别进行基于深度学习的图像分类识别,确定出目标网站的图片识别结果。本发明在获取目标网站的内容后,对文本内容进行精确匹配和/或自然语言分析处理以获得文本识别结果;对图片文件和展示效果截图进行深度学习以获得图片识别结果。可以有效地判断该网站是否存在不良内容,减少误判率。
-
公开(公告)号:CN109951739A
公开(公告)日:2019-06-28
申请号:CN201910241011.1
申请日:2019-03-27
Applicant: 北京市博汇科技股份有限公司
IPC: H04N21/442 , H04N21/24 , H04N21/258 , H04N17/00 , G06F16/17
Abstract: 本申请提供一种视频业务处理方法、装置及电子设备。方法包括:基于预设的视频业务获取与所述视频业务对应的爬虫任务集及配置文件;基于所述配置文件为所述爬虫任务集中的爬虫任务分配账号和进程,所述配置文件记录所述爬虫任务集中的每个爬虫任务对应的账号和进程,其中,所述爬虫任务集中的不同的第一爬虫任务对应的第一账号不相同,所述第一爬虫任务为需要重复登录账号的任务,每个所述第一账号与一个爬虫任务对应,且与所述第一账号对应的爬虫任务为所述第一爬虫任务;根据为所述爬虫任务集中的爬虫任务分配的账号和进程执行所述爬虫任务集中的爬虫任务,能够改善因采集数据速率低导致视频业务监测的效率低的技术问题。
-
-
-