-
公开(公告)号:CN107766481B
公开(公告)日:2020-08-07
申请号:CN201710951000.3
申请日:2017-10-13
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F16/958 , G06F16/906 , G06Q40/00
Abstract: 本发明公开了一种发现互联网金融平台的方法和系统。所述方法包括:根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台。本发明通过从多个数据渠道,采集疑似互联网金融平台,包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,还通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
-
公开(公告)号:CN112149413A
公开(公告)日:2020-12-29
申请号:CN202010932371.9
申请日:2020-09-07
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。
-
公开(公告)号:CN110930165A
公开(公告)日:2020-03-27
申请号:CN201911090024.X
申请日:2019-11-08
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06Q30/00 , G06Q40/06 , G06F40/289
Abstract: 本发明公开了一种互联网金融网站的异常检测方法及装置,该方法包括:获取互联网金融网站的文本信息;当所述文本信息中存在收益率关键词时,从所述文本信息中提取所述收益率关键词对应的收益率数值;根据所述收益率关键词以及所述收益率关键词对应的收益率数值,确定最大收益率;当所述最大收益率大于预设收益率时,确定所述互联网金融网站存在异常。通过本发明,从互联网金融网站中提取该网站公示的收益率,当提取的收益率过高时,说明该互联网金融网站存在高风险或诈骗特征,因此,认定该网站存在异常,从而认定该网站所属公司处于经营异常状态,实现了对互联网金融公司实行有效监管。
-
公开(公告)号:CN111045659A
公开(公告)日:2020-04-21
申请号:CN201911094400.2
申请日:2019-11-11
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F8/30
Abstract: 本发明公开了一种采集互联网金融网页的项目列表的方法及系统,该方法包括:脚本生成端展示互联网金融网页对应的可视化配置界面;脚本生成端根据用户在可视化配置界面上的配置操作生成项目列表采集脚本,并将项目列表采集脚本存储至数据库;当时间到达项目列表采集脚本的执行时间点时,脚本生成端从数据库中取出项目列表采集脚本,并将项目列表采集脚本放入任务队列;脚本生成端将任务队列中的项目列表采集脚本分发至执行端;执行端运行项目列表采集脚本,得到项目列表采集信息,并将项目列表采集信息存储至执行端的本地文件系统。通过本发明,通过可视化配置方式,极大的简化了脚本配置工作,从而提高了数据采集效率。
-
公开(公告)号:CN111078869A
公开(公告)日:2020-04-28
申请号:CN201911083838.0
申请日:2019-11-07
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于神经网络对金融网站进行分类的方法及装置,该方法包括:获取多个金融网站的文本数据,并根据各个金融网站的网站类别对各个金融网站设置对应的标记,根据所述多个金融网站的文本数据以及标记得到多组训练数据;通过所述多组训练数据对预置卷积神经网络模型进行迭代训练,得到目标卷积神经网络模型;将待识别金融网站的文本数据转化为待识别词向量,将所述待识别词向量输入所述目标卷积神经网络模型,得到所述待识别金融网站的类别预测结果。通过本发明,以金融网站的文本数据为基础,借助卷积神经网络模型,实现了对金融网站进行细分类的目的,减少了执行网站分类任务时的人工成本。
-
公开(公告)号:CN111026984A
公开(公告)日:2020-04-17
申请号:CN201911083929.4
申请日:2019-11-07
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F16/955 , G06Q30/00 , G06Q40/00
Abstract: 本发明公开了一种互联网金融公司的经营状态检测方法及装置,该方法包括:获取互联网金融公司的网站首页的URL,并根据所述URL提取网站首页的源代码;当检测到所述网站首页的源代码中存在目标标签时,从所述网站首页的源代码中获取所述互联网金融公司的实际经营地址;获取所述互联网金融公司的工商注册地址;当所述实际经营地址与所述工商注册地址不一致时,认定所述互联网金融公司处于经营异常状态。通过本发明,从互联网金融公司经营的网站中发现和提取实际的经营地址,并将实际经营地址与注册地址不一致作为企业经营异常指标,实现了对互联网金融公司的有效监管。
-
公开(公告)号:CN107766481A
公开(公告)日:2018-03-06
申请号:CN201710951000.3
申请日:2017-10-13
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
CPC classification number: G06F16/353 , G06F16/958 , G06Q40/00
Abstract: 本发明公开了一种发现互联网金融平台的方法和系统。所述方法包括:根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台。本发明通过从多个数据渠道,采集疑似互联网金融平台,包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,还通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
-
公开(公告)号:CN111325021A
公开(公告)日:2020-06-23
申请号:CN202010097890.8
申请日:2020-02-17
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种识别微信公众号所属业态的方法及装置,包括:获取微信公众号的文本数据集,基于所述文本数据集进行BERT模型预训练,得到BERT中文词向量;从所述文本数据集中提取文本特征词,并基于所述BERT中文词向量对所述文本特征词进行向量化,得到字向量序列;将所述字向量序列输入LSTM-CNN模型,得到所述LSTM-CNN模型输出的目标特征向量;将所述目标特征向量输入softmax层,得到所述softmax层输出的概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述微信公众号的所属业态。通过本发明,实现了高精度识别微信公众号的所属业态。
-
公开(公告)号:CN109657114B
公开(公告)日:2023-11-03
申请号:CN201810953361.6
申请日:2018-08-21
Applicant: 国家计算机网络与信息安全管理中心 , 中科国力(镇江)智能技术有限公司
IPC: G06F16/951 , G06F16/9535 , G06F16/81
Abstract: 本发明公开了一种抽取网页半结构化数据的方法,包括:从web站点爬取页面;人工定制化爬取目标页的url;配置一类网站的关键词词根;对类似的网页进行分析,根据case1,case2,case3进行分类判别,并对复杂的嵌套情况加以处理,抽取出网页模板。通过指定的url选出同类(栏目)url,同栏目url对应的html文本结构相似,遍历所有html节点,通过节点间的联系或节点本身,发现对应关键词的模板。从一个网站的所有子url中,找出和人工给定的相似的url。把目标格式分为case1,case2,case3,三种情况,对每一种情况分别进行处理,生成网页模板。
-
公开(公告)号:CN113378090A
公开(公告)日:2021-09-10
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
-
-
-
-
-
-
-
-