-
公开(公告)号:CN111680225A
公开(公告)日:2020-09-18
申请号:CN202010338132.0
申请日:2020-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/35 , G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本发明公开了一种基于机器学习的微信消息分析方法,包括:步骤一、构建训练语料库;步骤二、建立词汇向量表;步骤三和步骤四、构建和训练卷积神经网络;步骤五、将待分析的微信消息对应的多个词汇对应的词向量构成的词向量矩阵输入至训练得到的卷积神经网络,输出得到该微信消息对应的所有标签的概率分布情况。本发明具有精准预测微信消息所属的金融分类标签的有益效果。本方法还公开了一种基于机器学习的微信消息分析系统,包括:数据采集组件;训练语料库;文本预处理组件;模型训练组件;源数据分类组件。本系统具有精准预测微信消息所属的金融分类标签的有益效果。
-
公开(公告)号:CN111666267A
公开(公告)日:2020-09-15
申请号:CN201910165555.4
申请日:2019-03-05
Applicant: 国家计算机网络与信息安全管理中心 , 北京梆梆安全科技有限公司
IPC: G06F16/215
Abstract: 本申请公开了一种数据清洗方法、装置及终端设备,该方法包括:获取待存入数据库的目标数据的数据标识;将所述目标数据的数据标识插入Redis存储系统的set集合,其中所述set集合中包括所述数据库中各数据分别对应的数据标识;当所述目标数据的数据标识插入失败时,删除所述目标数据。本申请解决了现有技术的数据清洗方式去重效率低,且难以在数据量级较大的场景下使用的问题。
-
公开(公告)号:CN111160005A
公开(公告)日:2020-05-15
申请号:CN201911168831.9
申请日:2019-11-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种基于事件演化知识本体的事件预测方法、装置及终端设备。其中,该方法包括:通过构建具备事件演化关系的事件演化本体知识库,从事件演化本体知识库中抽取出第一事件链和第一事件元组,采用远程监督的方式,利用第一事件元组和第一事件链对非结构化文本进行关系数据回标,得到具有事件演化关系的事件数据,利用事件数据训练以建立事件预测模型的方法,可以基于知识有效的快速获得大量已标注的训练数据,从而有效提升事件预测的准确度。
-
公开(公告)号:CN106294336B
公开(公告)日:2020-02-14
申请号:CN201510236795.0
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535
Abstract: 本发明公开一种用于微博的突发特征检测方法及装置,涉及网络信息挖掘技术领域,用以解决现有技术中微博信息噪音大、数据多样突发特征检测准确率低的问题。所述方法包括:根据信息流中有意义串的被检特征的瞬时爆发情况,检测出候选突发特征;将所述候选突发特征中的频繁伪突发特征和间歇性伪突发特征滤除。
-
公开(公告)号:CN106294335B
公开(公告)日:2020-01-14
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
公开(公告)号:CN109472691A
公开(公告)日:2019-03-15
申请号:CN201811281448.X
申请日:2018-10-31
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
IPC: G06Q40/02
Abstract: 本发明涉及金融风险监测领域,具体的说是一种互联网金融企业异常预警排名方法及软件系统;包括有以下步骤,首先确定异常类型;确定每个异常类型下的异常指标;根据各异常类型下触发异常预警阈值的指标个数,确定该异常类型下各互联网金融企业的单项异常预警排名根据异常类型的个数对所有企业进行综合排序;采用本发明技术方案的异常预警排名方法,既能、从单个异常类型角度对所有互联网金融企业进行单项排名,也能从综合所有异常类型对所有互联网金融企业进行综合排名,便于使用者根据企业异常预警排名或是自己重点关注的异常类型的排名进行选择与决策。
-
公开(公告)号:CN107944559A
公开(公告)日:2018-04-20
申请号:CN201711190865.9
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06N5/022 , G06N3/0454
Abstract: 本发明涉及一种实体关系自动识别方法及系统,该方法包括:训练卷积神经网络得到实体关系识别模型;获取对应待确认实体组的相关语料库;将相关语料进行分词,并将分词得到的相关词语转化为相关词向量;将相关词向量按相关语料转化为矩阵作为实体关系识别模型的输入,得到相关关系种类和相关关系种类的相似度值,将相似度值高的相关关系种类作为待确认实体组的关系种类。本发明通过锻炼卷积神经网络作为实体关系识别模型,在出现新增实体时,计算得到一系列新增实体组的关系种类,并得出每一项关系种类的相似度值,通过具体的数值来确定相关关系种类的程度,提高得到的新增实体组之间关系种类的准确性。
-
公开(公告)号:CN106294335A
公开(公告)日:2017-01-04
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
公开(公告)号:CN106294333A
公开(公告)日:2017-01-04
申请号:CN201510236634.1
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。
-
公开(公告)号:CN106294332A
公开(公告)日:2017-01-04
申请号:CN201510236598.9
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种微博话题特征提取方法及装置,用以解决目前采用静态词典中的词语特征来表示微博文本,会遗漏大量的关键特征,不能准确反映实时微博信息的问题。该方法包括:提取微博中的有意义字符串,有意义字符串为包含具有语义、能够独立使用的语言单元;提取有意义字符串的异质属性信息;根据异质属性信息对有意义字符串进行分类,得到微博话题相关的特征项,采用该方案能提高微博信息中的特征项提取的准确性。
-
-
-
-
-
-
-
-
-