-
公开(公告)号:CN108595582A
公开(公告)日:2018-09-28
申请号:CN201810345881.9
申请日:2018-04-17
Applicant: 北京理工大学
Abstract: 本发明的目的是提出一种基于聚类特征模型的灾害性气象热点事件识别方法。具体步骤为:步骤一、构建灾害性气象关键词典。步骤二、对社会信号数据库中的数据进行预处理和特征提取。步骤三、发现与识别灾害性气象事件。本发明提出的基于聚类特征模型的灾害性气象热点事件识别方法与已有技术相比较,其优点在于:①在当前没有公认的气象相关关键词词典的环境下构建面向实际环境的关键词词典。②通过针对互联网中社会信号的处理,从“公众最关心”的角度发现识别气象事件,实现了基于社会的公众热点和基于自然的气象观测与预报之间的统一。③针对气象领域的特征进行了提取和聚类,从而相较于传统的通用事件发现方法提高了事件识别的准确率。
-
公开(公告)号:CN104679885B
公开(公告)日:2018-03-30
申请号:CN201510116518.6
申请日:2015-03-17
Applicant: 北京理工大学
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于语义特征模型的用户搜索串机构名识别方法。其包括模型构建阶段和识别阶段的处理过程。在模型构建阶段,利用已有的长文本标注语料库,构建符合用户搜索串分布的训练语料库,该语料库除保存了传统原有分词、词性标注的特征,更增加了查询串中的上下文特征、粘合度特征相关语义环境特征,根据复合语义特征建立条件随机场模型作为机构名识别模型。在识别阶段,通过计算用户搜索串的相应语义环境特征得到用户查询串的模式序列,抽取符合机构名的模式序列,即获得用户搜索串中的机构名。本方法使用户搜索串中机构名识别的准确率和召回率得到了综合的提升。
-
公开(公告)号:CN105955990A
公开(公告)日:2016-09-21
申请号:CN201610245146.1
申请日:2016-04-19
Applicant: 北京理工大学
CPC classification number: G06F16/951 , G06F17/2705
Abstract: 本发明涉及一种兼顾多样性和有效性的评论排序和筛选方法,具体为:①从待排序评论集中提取评论目标的特征集。②依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数。③对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中。④在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序。⑤设定选取数量为m,从每个聚类中选取前n为聚类数。然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示。本发明方法使评论列表排序效果更符合人类认知,能够优先输出对其他用户更有帮助的列表排序,而且兼顾评论内容的全面性。
-
公开(公告)号:CN103678895B
公开(公告)日:2016-06-29
申请号:CN201310646349.8
申请日:2013-12-04
Applicant: 北京理工大学
IPC: G06F19/00
Abstract: 本发明涉及一种基于文献分析及核磁功能共振图像分析的脑连接挖掘系统及挖掘方法,属于计算机技术与认知神经科学技术领域。该系统包括动态因果模型模块、激活分析模块、文献连接分析模块、寻找子网络模块、文献数据库、脑网络连接数据库;首先通过计算每篇文献中大脑各个坐标被激活的概率,计算出相应解剖区域被激活的概率,得到被激活的脑区,通过关联规则算法挖掘出大脑脑区频繁出现的模式,计算置信度,得到可信的大脑功能网络,构建相应的文献生成脑网络数据库,然后利用核磁功能共振成像系统,采集相应的核磁功能成像数据,利用动态因果模型,验证该网络边的实际连接方向以及权值。解决了大脑连接分析时计算时间过长,准确度低的问题。
-
公开(公告)号:CN104679885A
公开(公告)日:2015-06-03
申请号:CN201510116518.6
申请日:2015-03-17
Applicant: 北京理工大学
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于语义特征模型的用户搜索串机构名识别方法。其包括模型构建阶段和识别阶段的处理过程。在模型构建阶段,利用已有的长文本标注语料库,构建符合用户搜索串分布的训练语料库,该语料库除保存了传统原有分词、词性标注的特征,更增加了查询串中的上下文特征、粘合度特征相关语义环境特征,根据复合语义特征建立条件随机场模型作为机构名识别模型。在识别阶段,通过计算用户搜索串的相应语义环境特征得到用户查询串的模式序列,抽取符合机构名的模式序列,即获得用户搜索串中的机构名。本方法使用户搜索串中机构名识别的准确率和召回率得到了综合的提升。
-
公开(公告)号:CN103810244A
公开(公告)日:2014-05-21
申请号:CN201310661131.X
申请日:2013-12-09
Applicant: 北京理工大学
CPC classification number: G06F17/30312
Abstract: 本发明涉及一种分布式数据存储系统的扩容方法,特别涉及一种基于数据分布的分布式数据存储系统的扩容方法,属于数据库领域。该方法通过拟合数据的产生概率,根据此概率计算具有最大溢出概率的存储节点,在此节点的数据存储区间上添加新的存储节点以分担负载,在不管数据是否为均匀分布以及存储节点的负载能力是否相同的情况下,都可以提高系统的利用率,维持负载均衡,以及减少节点之间数据移动次数。
-
公开(公告)号:CN102253982B
公开(公告)日:2013-03-20
申请号:CN201110172766.4
申请日:2011-06-24
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理;二、对用户输入的查询数据进行分词、过滤停用词的预处理;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;四、基于知网中的词概念相关度计算方法,将用户查询数据串与查询日志库中日志信息逐条进行语义相关度计算;五、将相似度和语义相关度进行融合,计算用户查询数据串与查询日志库中每条日志信息的查询语义相关度;六、按照步骤五中的相关度由大到小,取出Top-N推荐给用户。本发明可以有效的消除查询歧义,并对输入错误进行提醒,提高信息检索系统的易用性和交互能力。
-
-
-
-
-
-