-
公开(公告)号:CN113761318A
公开(公告)日:2021-12-07
申请号:CN202110484421.6
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/953 , G06F16/33 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种网页风险发现的方法,包括下列步骤:S1、数据采集阶段,使用高效蔓延的基本原理,获取到网站大量的网页;S2、数据流转阶段,使用Confluent接入Kafka中数据,调用风险识别服务后,将数据存储至Elasticsearch中,完成整个数据流转;S3、风险识别阶段,针对采集到的数据进行分词,与风险规则库中数据进校对,将符合风险规则数据保存;S4、数据存储阶段,针对采集的原始数据进行处理,然后对处理后的数据,根据数据类型、规模、用途按需存储;S5、风险发现整体流程完成。有益效果:在海量网页数据中能够快速的定位风险网站。
-
公开(公告)号:CN118799615A
公开(公告)日:2024-10-18
申请号:CN202410677112.4
申请日:2024-05-29
Applicant: 中科天玑数据科技股份有限公司
IPC: G06V10/764 , G06V30/19 , G06F40/279
Abstract: 本发明提供一种有害图像检测方法,包括提取图像内文字以生成文字信息,多模态大模型接收并识别图像,以生成描述图像展示场景的图文信息,并生成总文本信息,总文本信息输入生成式大语言模型,依据图像的文字描述内判断图像是否有害,并输出判断结果文本。本发明能够实现零样本训练,即可检测各种类型有字或无字有害图像,提高有害图像识别的智能化程度和可扩展性。
-
公开(公告)号:CN113761386A
公开(公告)日:2021-12-07
申请号:CN202110481580.0
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种人物社交关系挖掘的方法,包括以下步骤:S1、抽取存储阶段,拉取采集数据流,抽取数据流中相关数据中的用户信息;S2、人物与账号关联计算阶段,通过比较获取最为相似的用户与该种子用户进行关联,构建形成人物数据;S3、人物社交关系计算阶段,设定置信度阈值,超过阈值的用户判断为发现的新用户,没有超过阈值的用户为其他用户,将计算结果及相关连的用户存储于图数据库;S4、展示修正阶段,将上述计算结果通过图谱形式进行展现,通过展现的结果进行相关的修正。有益效果:通过人物账号关联及账号社交关系挖掘得到较为精确的人物社交关系。
-
公开(公告)号:CN113761319A
公开(公告)日:2021-12-07
申请号:CN202110484453.6
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/953
Abstract: 本发明公开了一种度量文章传播影响力的方法,包括下列步骤:S1、数据采集:利用已有的数据采集技术,对影响力计算所需的各类数据进行次采集;S2、数据分析处理:对已采集的数据进行分析处理;S3、信源影响力计算:对信源的影响力进行综合计算,得出[0,100]整数区间内的影响力数值;S4、新闻稿件影响力计算:结合信源影响力,计算目标稿件的影响力,得出[0,100]整数区间内的影响力数值;S5、事件/任务影响力计算:对事件/任务聚合的新闻稿件影响力融合计算,得出事件/任务的的影响力数值。有益效果:通过算法对新闻信息的综合传播效果进行量化计算,用于新闻信息间的影响力对比分析。
-
-
-