-
公开(公告)号:CN115827871A
公开(公告)日:2023-03-21
申请号:CN202211690035.3
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/35 , G06N3/08 , G06F18/241 , G06N3/0464
Abstract: 本发明提供了一种互联网企业分类的方法和装置,其中该方法包括:S1:获取互联网企业的多维度数据,并对所述多维度数据预处理以生成长文本数据;S2:将所述长文本数据输入基于Transformer编码器的Bert网络模型进行处理;S3:将经过处理后的数据送入分类器来对所述互联网企业进行分类。本发明的方案基于在Transformer架构的深度神经网络中进行自动特征组合学习,能够对互联网企业准确进行行业分类,并能够极大提升互联网企业行业分类的准确率。本发明的方案能够快速将海量企业多维度信息进行识别,无需人工干预。本发明的方案基于大语料预训练模型加下游任务微调的方案能灵活应用在不同场景中海量企业的快速分类。
-
公开(公告)号:CN115374325A
公开(公告)日:2022-11-22
申请号:CN202210614028.9
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明实施例涉及一种网站分类方法、装置、分类设备及存储介质,所述方法包括:在提取网站中的文本信息时,对所述文本信息进行预处理,获得文本数据集;在提取网站中的图像信息时,对所述图像信息进行预处理,获得图像数据集;对所述文本数据集进行特征提取,获得文本特征向量;对所述图像数据集进行特征提取,获得图像特征向量;基于Bert‑ResNet融合模型对获取的所述文本特征向量和所述图像特征向量进行信息融合,得到相应的融合结果,所述融合结果表征所述网站的分类结果;通过将文本信息和图像信息在Bert‑ResNet融合模型中进行融合处理,实现文本信息和图像信息互补的多模态网站分类处理,提高网站分类的准确率的技术效果。
-
公开(公告)号:CN112801788A
公开(公告)日:2021-05-14
申请号:CN202110072819.9
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q40/04
Abstract: 本发明公开了一种互联网股权融资平台监控系统及监控方法,包括以下模块:规则管理模块:用于设定和维护互联网股权融资规则;数据预处理模块:用于采集或导入信息,并将信息标准化处理后存入数据库;平台发现模块:通过分析互联网公开信息,根据规则管理模块发现互联网股权融资平台;风险计算分析处理模块:用于规则管理模块对互联网股权融资平台进行风险指标分析以及对监测范围内互联网股权融资平台进行综合分析和评级;预警通知模块:用于将判定有风险的互联网股权融资平台进行预警通知;综合展示模块:采用可视化页面展示风险平台地域分布、数量分布等信息。本发明的有益效果为:全面提升互联网股权融资平台的监测能力。
-
公开(公告)号:CN112182020A
公开(公告)日:2021-01-05
申请号:CN202011184465.9
申请日:2020-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/242 , G06F40/289 , G06Q30/06 , G06Q30/08 , G06Q40/02 , G06Q40/04 , G06Q40/06 , G06N3/04
Abstract: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN110276680A
公开(公告)日:2019-09-24
申请号:CN201910441730.8
申请日:2019-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: G06Q40/02
Abstract: 本发明公开了一种应用于互联网金融的真实数据获取方法,涉及国家互联网金融监测领域。首先梳理各网贷机构业务的交易明细数据,进行业务评估;各网贷机构在本地存储一份符合标准的数据,并进行自查,将自查的数据接入国家互联网应急中心。然后各网贷机构通过SDK工具包进行埋点,国家互联网应急中心对各网贷机构实时接入的交易明细数据进行正确性验证,并反馈给网贷机构;同时抽取各网贷机构接入的实时交易数据,按出借和借款业务形成数据流,围绕出借人和借款人两个维度生成披露数据。最后国家互联网应急中心对用户开放数据查验,查验反馈窗口。本发明实现对网贷机构实时接入数据的真实性验证以及进行实时、动态监管的目的。
-
公开(公告)号:CN114819432B
公开(公告)日:2025-04-11
申请号:CN202110065882.X
申请日:2021-01-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0635
Abstract: 本发明实施例涉及一种企业非法集资风险预测方法、装置、电子设备及存储介质,所述方法包括:获取待进行非法集资风险预测的目标企业的企业数据;对所述企业数据进行特征提取,得到所述目标企业的企业特征;将所述企业特征输入至至少一个已训练的非法集资风险预测模型,得到至少一个所述目标企业非法集资的风险概率;根据至少一个所述目标企业非法集资的风险概率确定所述目标企业是否存在非法集资风险。由此,可以提高对企业非法集资风险进行预测的预测结果的准确性。
-
公开(公告)号:CN114817485B
公开(公告)日:2024-09-06
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F18/241
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
公开(公告)号:CN117609497A
公开(公告)日:2024-02-27
申请号:CN202311343043.5
申请日:2023-10-17
Applicant: 国家计算机网络与信息安全管理中心 , 中网数安(北京)科技有限公司 , 联洋国融(北京)科技有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本发明提供一种文本有害内容无监督识别方法及装置。所述方法包括:获取待识别的多个文本,计算每个待识别文本的特征向量;计算有害文本分类库中每个有害文本类别的特征向量,有害文本分类库包括每种有害文本类别的标识词;计算待识别文本的特征向量与每个有害文本类别的特征向量的相似度,若所述相似度的最大值超过设定阈值,则所述最大值对应的有害文本类别为所述待识别文本的类别。本发明通过构建有害文本分类库,并通过相似度计算,能够对文本中的有害内容进行无监督识别,解决了基于有监督学习的现有识别方法存在的需要不断地对新的大量文本数据进行标注,耗费大量的人工和时间的问题。
-
公开(公告)号:CN116827510A
公开(公告)日:2023-09-29
申请号:CN202310549108.5
申请日:2023-05-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L9/00 , H04L9/40 , G06Q40/04 , G06F40/295
Abstract: 本发明公开了基于多元化数据融合的虚拟货币地址实体识别方法及系统;涉及区块链应用技术领域;收集链下情报并整合形成统一结构的情报数据,用于引导虚拟货币实体特征工程的构建,将虚拟货币地址与链下实际控制实体进行关联,结合实体特征、虚拟货币交易的特定业务逻辑以及情报线索,对大量的目标实体进行深度过滤,得到可观数量的可疑实体,并采用深度搜索组合方式,得到所有符合情报线索的实体组合;基于链下多渠道情报数据与链上交易数据的关联分析,达到建立有效、快速、准确的识别出持有虚拟货币的实体的目的。
-
公开(公告)号:CN116578904A
公开(公告)日:2023-08-11
申请号:CN202310549102.8
申请日:2023-05-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/214 , G06F16/27 , G06N20/20 , G06Q40/04
Abstract: 本发明公开了基于集成机器学习的区块链地址属性分类方法及系统,涉及区块链应用技术领域;先搭建基于UTXO的区块链全节点,获取区块链的明细交易数据并进行预处理;然后进行特征构建:对预处理后的明细交易数据进行地址分析得到地址交易特征,实体聚类分析得到实体交易特征,并构建实体交易子图;将地址交易特征、实体交易特征和实体交易子图输入XGBoost模型和GCN模型中进行训练和集成得到最终分类模型;基于最终分类模型对区块链地址属性分类进行预测;本发明基于决策树分类器与图神经网络的子图分类器的集成模型,进而达到建立有效、准确的识别出基于UTXO的区块链地址的类别,达到去匿名化的目的。
-
-
-
-
-
-
-
-
-