-
公开(公告)号:CN107784387A
公开(公告)日:2018-03-09
申请号:CN201710843010.5
申请日:2017-09-18
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06Q10/04 , G06F17/30675 , G06Q50/01
Abstract: 本发明公开了一种微博事件信息传播的连续动态预测方法,属于数据挖掘领域。针对新浪微博,在目前给定传播信息的基础上,试图预测下一阶段的微博总数量;按小时划分事件传播,利用事件从发生到当前时间段内传播特征,如微博量、参与人数、微博情绪等,基于GBDT模型预测下一小时内事件微博传播的总数。本发明预测模型中最优时间段长度和微博特征组合,是在全面衡量各特征的贡献度和相关性的基础上筛选出来的,不仅能够有效提高模型预测精度,平均模型精度超过70%,还能减小计算复杂性,避免无用计算,有效支持针对事件的预警和干预措施。
-
公开(公告)号:CN106227766A
公开(公告)日:2016-12-14
申请号:CN201610559551.0
申请日:2016-07-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种大数据驱动的选举舆情预测方法,属于数据挖掘领域。具体为:首先,根据选举国家或地区的互联网网路使用报告和地区网站排名,挑选出大数据信息源;再对每一类信息源进行分析,构建民意预测指标;然后融合提取出的多源预测指标,形成当前互联网民众支持率;进而收集民调报告,融合报告中各年龄段人群对候选人的支持率,形成线下民调支持率值;考虑选举国家或地区人口结构构成和网民年龄分布,融合候选人互联网支持率值与线下民调支持率值,运用移动平均方法,预测下一时间节点候选人支持率值,预测结果以日频度更新。本发明具有数据源广泛、预测周期短、实时性强等特点,在舆情监控和观点分析等领域有重要的应用价值。
-
公开(公告)号:CN114896522B
公开(公告)日:2023-04-07
申请号:CN202210382759.5
申请日:2022-04-14
Applicant: 北京航空航天大学
IPC: G06F16/9537 , G06F16/951 , G06F18/241 , G06Q10/0639 , G06Q10/0635 , G16H50/80
Abstract: 本发明公开了多平台信息疫情风险评估方法,包括:步骤一:采集各平台的流数据;步骤二:对每条流数据,提取域名列表,获得域名重定向历史信息,并与域名可靠性语料库匹配,获得流数据的可靠性标签;步骤三:对每条流数据,解析用户自定义位置,获得地理信息;步骤四:按照地理信息、时间两个维度对流数据进行分组;步骤五:对每组流数据,基于用户粉丝数、可靠性标签,量化静态信息疫情风险指标值;步骤六:对每组流数据,基于点赞数、转发数、评论数、可靠性标签,量化动态信息疫情风险指标值。本发明还提供了评估装置。本发明通过构建静态信息疫情风险指标和动态信息疫情风险指标,反映了信息疫情的风险上限和信息疫情程度。
-
公开(公告)号:CN111583012B
公开(公告)日:2021-09-21
申请号:CN202010208514.1
申请日:2020-03-23
Applicant: 北京航空航天大学
IPC: G06Q40/02 , G06F16/33 , G06F16/35 , G06F40/284
Abstract: 本发明公开了一种融合文本信息的信用债发债主体违约风险评估方法,包括:构建违约词典;计算新闻舆情负面程度值;获取宏观数据、财务数据、是否发生违约的数据;构建训练样本和测试样本;以上一季度的宏观数据、新闻舆情负面程度值和财务数据为输入值,以下一季度是否发生违约的数据为输出值,构建评估模型,训练并测试得到稳定的评估模型;将待评估发债主体的新闻舆情负面程度值、宏观数据、财务数据输入至评估模型,输出得到该发债主体在当前季度是否发生违约的评估数据。本发明具有融合文本信息,将难以利用结构化数据度量,且引入评估时存在较大的主观随意性的指标,以更为客观的方式纳入风险评估过程中,增强评估方法的可信度的有益效果。
-
公开(公告)号:CN111860518A
公开(公告)日:2020-10-30
申请号:CN202010614266.0
申请日:2020-06-30
Applicant: 北京航空航天大学
Abstract: 本公开的实施例公开了用于分割图像的方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:将输入图像输入预先训练的通用子网络,得到通用特征;将输入图像输入预先训练的特定任务子网络,得到特定任务特征;基于注意力机制网络,将该通用特征添加到该特定任务特征上,得到目标任务特征;对该特定任务特征进行解码操作,得到融合特征;利用渐进网络对该目标任务特征和该融合特征进行集成,得到该输入图像的分割图。该实施方式实现了基于特定任务特征对图像进行分割。
-
公开(公告)号:CN110689439A
公开(公告)日:2020-01-14
申请号:CN201910828709.3
申请日:2019-09-03
Applicant: 北京航空航天大学
Abstract: 本发明公开了基于level II数据的尾盘操纵识别方法,包括以下步骤:步骤一、构建股票高频数据库,并每日持续更新;步骤二、构建五个有效的监测指标:Return end、Return mid、Frequence trade、Frequence money和Abnormaltrade;步骤三、对上述五个监测指标进行综合分析后,判断疑似尾盘操纵的股票。本发明通过深入分析股票逐笔成交量、成交价、成交时间等高频数据集,对资本市场上存在的尾盘操纵现象能进行精准识别。
-
-
公开(公告)号:CN103530402A
公开(公告)日:2014-01-22
申请号:CN201310502924.7
申请日:2013-10-23
Applicant: 北京航空航天大学
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明公开了一种基于改进的PageRank的微博关键用户识别方法,包括输入微博信息数据,其中包括n条微博;对n条微博文本进行分词处理;根据分词结果建立倒排索引结构,便于根据指定关键词检索;根据检索到的相关微博提取其转发层级信息,构建加权有向图即转发网络G;将转发网络G划分为若干个极大连通子图Gi;利用并行化计算技术在每个子网络Gi应用PageRank算法;将各个子网络的计算结果融合生成整个网络生成整个网络G的排序结果;将排序结果选择前m条作为关键用户输出。本发明采用并行计算技术,在大数据环境下针对微博平台的动态转发网络进行排序计算,从而识别信息传播过程中的关键用户,应用于网络舆情分析等领域。
-
公开(公告)号:CN103049581A
公开(公告)日:2013-04-17
申请号:CN201310025642.2
申请日:2013-01-21
Applicant: 北京航空航天大学
IPC: G06F17/30
Abstract: 本发明公开了基于一致性聚类的Web文本分类方法,包括:输入一段文字信息数据,其中包括n个文本;根据含有m个词汇的预设词库,对n个文本进行分词处理;根据每个文本中的分词在词库中出现的次数,制作每个文本的m维向量空间模型,n个文本组合在一起形成n×m的向量空间矩阵;在n×m的向量空间矩阵中随机提取n×m′的子矩阵,其中m′小于m,对n×m′子矩阵进行聚类分析;重复上述步骤r次,直到得到r个聚类分析结果;将r个聚类分析结果再进行聚类分析,得到最终聚类结果,这个最终聚类结果表征n个文本之间的归类关系,由此将n个文本分类。本方法能够克服聚类分析中的维度灾难,对海量文本数据进行分析,特别适合网络舆情监控等信息安全领域。
-
公开(公告)号:CN119671301A
公开(公告)日:2025-03-21
申请号:CN202411504801.1
申请日:2024-10-27
Applicant: 北京航空航天大学
IPC: G06Q10/0637 , G06N3/082 , G06N3/04
Abstract: 本发明公开了一种增强神经网络模型鲁棒性的训练方法及其在波动率曲面预测中的应用。增强神经网络模型鲁棒性的训练方法,其包括:步骤一、通过计算待训练的神经网络模型的输出值与真实值间的回归指标,得到第一损失值L1;步骤二、利用生成模型中计算第二损失值L2;步骤三、基于第一损失值L1和第二损失值L2,结合第三损失值L3构建损失函数;步骤四、基于构建的损失函数对待训练的神经网络模型进行迭代训练学习。本发明通过引入理论数据训练生成模型,利用生成模型计算似然值,利用似然值对神经网络模型的损失函数进行修正,最小化训练数据集的误差,降低神经网络模型受训练数据集的影响,进而达到增强神经网络模型鲁棒性的目的。
-
-
-
-
-
-
-
-
-