-
公开(公告)号:CN115374325A
公开(公告)日:2022-11-22
申请号:CN202210614028.9
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明实施例涉及一种网站分类方法、装置、分类设备及存储介质,所述方法包括:在提取网站中的文本信息时,对所述文本信息进行预处理,获得文本数据集;在提取网站中的图像信息时,对所述图像信息进行预处理,获得图像数据集;对所述文本数据集进行特征提取,获得文本特征向量;对所述图像数据集进行特征提取,获得图像特征向量;基于Bert‑ResNet融合模型对获取的所述文本特征向量和所述图像特征向量进行信息融合,得到相应的融合结果,所述融合结果表征所述网站的分类结果;通过将文本信息和图像信息在Bert‑ResNet融合模型中进行融合处理,实现文本信息和图像信息互补的多模态网站分类处理,提高网站分类的准确率的技术效果。
-
公开(公告)号:CN113157540A
公开(公告)日:2021-07-23
申请号:CN202110348169.6
申请日:2021-03-31
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F11/34 , G06F16/955
Abstract: 本发明提出了一种用户行为分析方法和系统。所述用户行为分析方法,包括以下步骤:从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;通过该HTML文件建立对应的平台词条;根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。本发明的用户行为分析方法和系统设计新颖,实用性强。
-
公开(公告)号:CN112801788A
公开(公告)日:2021-05-14
申请号:CN202110072819.9
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q40/04
Abstract: 本发明公开了一种互联网股权融资平台监控系统及监控方法,包括以下模块:规则管理模块:用于设定和维护互联网股权融资规则;数据预处理模块:用于采集或导入信息,并将信息标准化处理后存入数据库;平台发现模块:通过分析互联网公开信息,根据规则管理模块发现互联网股权融资平台;风险计算分析处理模块:用于规则管理模块对互联网股权融资平台进行风险指标分析以及对监测范围内互联网股权融资平台进行综合分析和评级;预警通知模块:用于将判定有风险的互联网股权融资平台进行预警通知;综合展示模块:采用可视化页面展示风险平台地域分布、数量分布等信息。本发明的有益效果为:全面提升互联网股权融资平台的监测能力。
-
公开(公告)号:CN112182020A
公开(公告)日:2021-01-05
申请号:CN202011184465.9
申请日:2020-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/242 , G06F40/289 , G06Q30/06 , G06Q30/08 , G06Q40/02 , G06Q40/04 , G06Q40/06 , G06N3/04
Abstract: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN112149413A
公开(公告)日:2020-12-29
申请号:CN202010932371.9
申请日:2020-09-07
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。
-
公开(公告)号:CN110276680A
公开(公告)日:2019-09-24
申请号:CN201910441730.8
申请日:2019-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: G06Q40/02
Abstract: 本发明公开了一种应用于互联网金融的真实数据获取方法,涉及国家互联网金融监测领域。首先梳理各网贷机构业务的交易明细数据,进行业务评估;各网贷机构在本地存储一份符合标准的数据,并进行自查,将自查的数据接入国家互联网应急中心。然后各网贷机构通过SDK工具包进行埋点,国家互联网应急中心对各网贷机构实时接入的交易明细数据进行正确性验证,并反馈给网贷机构;同时抽取各网贷机构接入的实时交易数据,按出借和借款业务形成数据流,围绕出借人和借款人两个维度生成披露数据。最后国家互联网应急中心对用户开放数据查验,查验反馈窗口。本发明实现对网贷机构实时接入数据的真实性验证以及进行实时、动态监管的目的。
-
公开(公告)号:CN114819432B
公开(公告)日:2025-04-11
申请号:CN202110065882.X
申请日:2021-01-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0635
Abstract: 本发明实施例涉及一种企业非法集资风险预测方法、装置、电子设备及存储介质,所述方法包括:获取待进行非法集资风险预测的目标企业的企业数据;对所述企业数据进行特征提取,得到所述目标企业的企业特征;将所述企业特征输入至至少一个已训练的非法集资风险预测模型,得到至少一个所述目标企业非法集资的风险概率;根据至少一个所述目标企业非法集资的风险概率确定所述目标企业是否存在非法集资风险。由此,可以提高对企业非法集资风险进行预测的预测结果的准确性。
-
公开(公告)号:CN114817485B
公开(公告)日:2024-09-06
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F18/241
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
公开(公告)号:CN117609497A
公开(公告)日:2024-02-27
申请号:CN202311343043.5
申请日:2023-10-17
Applicant: 国家计算机网络与信息安全管理中心 , 中网数安(北京)科技有限公司 , 联洋国融(北京)科技有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本发明提供一种文本有害内容无监督识别方法及装置。所述方法包括:获取待识别的多个文本,计算每个待识别文本的特征向量;计算有害文本分类库中每个有害文本类别的特征向量,有害文本分类库包括每种有害文本类别的标识词;计算待识别文本的特征向量与每个有害文本类别的特征向量的相似度,若所述相似度的最大值超过设定阈值,则所述最大值对应的有害文本类别为所述待识别文本的类别。本发明通过构建有害文本分类库,并通过相似度计算,能够对文本中的有害内容进行无监督识别,解决了基于有监督学习的现有识别方法存在的需要不断地对新的大量文本数据进行标注,耗费大量的人工和时间的问题。
-
公开(公告)号:CN116827510A
公开(公告)日:2023-09-29
申请号:CN202310549108.5
申请日:2023-05-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L9/00 , H04L9/40 , G06Q40/04 , G06F40/295
Abstract: 本发明公开了基于多元化数据融合的虚拟货币地址实体识别方法及系统;涉及区块链应用技术领域;收集链下情报并整合形成统一结构的情报数据,用于引导虚拟货币实体特征工程的构建,将虚拟货币地址与链下实际控制实体进行关联,结合实体特征、虚拟货币交易的特定业务逻辑以及情报线索,对大量的目标实体进行深度过滤,得到可观数量的可疑实体,并采用深度搜索组合方式,得到所有符合情报线索的实体组合;基于链下多渠道情报数据与链上交易数据的关联分析,达到建立有效、快速、准确的识别出持有虚拟货币的实体的目的。
-
-
-
-
-
-
-
-
-