-
公开(公告)号:CN101296128A
公开(公告)日:2008-10-29
申请号:CN200710098645.3
申请日:2007-04-24
Applicant: 北京大学
CPC classification number: G06F17/30861
Abstract: 本发明提供了一种通过对互联网信息中热点词汇的频率所发生的变化进行监测,从而对互联网信息进行异常状态监测的方法。该方法包括以下步骤:一、获取通用词汇在当日互联网页中出现的当日词频数据;二、结合用户关注的热点词汇词典,确定互联网信息的当日关键词集合;三、确定每个当日关键词的权重;四、确定当日关键词的异常阀值;五、检测当日关键词的异常程度并确定当日热点互联网信息。本发明通过对互联网信息中热点词汇的频率所发生的变化进行监测,计算关键词的异常程度,对热点词汇的词频变化的异常程度进行预测和报警。可以使得互联网信息使用者在第一时间做出反应。
-
公开(公告)号:CN101645066B
公开(公告)日:2011-08-24
申请号:CN200810117821.8
申请日:2008-08-05
Applicant: 北京大学
Abstract: 本发明公开了一种互联网新颖词监测方法,属于互联网信息挖掘领域。本发明方法包括下列步骤:根据目标信息源集合,获得其中各个首页及其内部链接所指向的各级下级页面中当日的所有文章;对各个文章作分词处理,并为各个文章中的每个词语赋予权重,以权重最大的前a个词语作为该文章的备选新颖词,并以该备选新颖词同时成为多个文章的备选新颖词时的文章数作为该词当天的频率freq;根据各个备选新颖词在b天内的freq记录计算各个备选新颖词的新颖系数n;根据新颖系数n确定新颖度θ,当某个备选新颖词的新颖度大于新颖度阈值θt时,即认为该词语是当天的新颖词。本发明方法可以有效地发现当天的新颖词汇,指导互联网新信息发现和监管的实践。
-
公开(公告)号:CN101645067A
公开(公告)日:2010-02-10
申请号:CN200810117822.2
申请日:2008-08-05
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种讨论区集合中热点讨论区的预测方法,属于互联网信息挖掘领域,其包括下列步骤:针对目标讨论区集合,确定待预测的时间窗口Wi+1;获得目标讨论区集合内的各个讨论区在时间窗口Wi-1和时间窗口Wi内的特征向量,所述特征向量由显示讨论区受关注程度的多个属性组成;在Wi内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析,并以得到的一个或多个类中心作为Wi内的热点讨论区;以各个讨论区在Wi-1内的特征向量作为输入并以Wi内的热点讨论区作为输出进行SVM学习;以各个讨论区在Wi内的特征向量作为上述学习后的SVM的输入,输出目标讨论区集合在Wi+1内的热点讨论区。本发明实现了讨论区集合中热点讨论区的预测,具有较好的应用前景。
-
公开(公告)号:CN101645066A
公开(公告)日:2010-02-10
申请号:CN200810117821.8
申请日:2008-08-05
Applicant: 北京大学
Abstract: 本发明公开了一种互联网新颖词监测方法,属于互联网信息挖掘领域。本发明方法包括下列步骤:根据目标信息源集合,获得其中各个首页及其内部链接所指向的各级下级页面中当日的所有文章;对各个文章作分词处理,并为各个文章中的每个词语赋予权重,以权重最大的前a个词语作为该文章的备选新颖词,并以该备选新颖词同时成为多个文章的备选新颖词时的文章数作为该词当天的频率freq;根据各个备选新颖词在b天内的freq记录计算各个备选新颖词的新颖系数n;根据新颖系数n确定新颖度θ,当某个备选新颖词的新颖度大于新颖度阈值θ t 时,即认为该词语是当天的新颖词。本发明方法可以有效地发现当天的新颖词汇,指导互联网新信息发现和监管的实践。
-
公开(公告)号:CN1870041A
公开(公告)日:2006-11-29
申请号:CN200510011769.4
申请日:2005-05-23
Applicant: 北京大学
IPC: G06Q40/00
Abstract: 本发明公开了一种用于期权价格计算和预测的方法和系统;根据本发明的方法包括步骤:对用户输入参数进行合理性验证;将用户输入的参数配置信息,和/或期权交易相关的交易品种的历史数据,存储到数据源中;根据用户输入参数、配置数据、应用期权价格模型进行价格计算和预测;将结算和预测结果显示出来。进一步还需要从数据库中获得交易历史信息计算期权定价过程的参数;以及用图形方式显示期权定价计算中间数据。本发明还提供了期权价格计算计算和预测的系统。
-
-
-
-