-
公开(公告)号:CN110413989A
公开(公告)日:2019-11-05
申请号:CN201910533898.1
申请日:2019-06-19
Applicant: 北京邮电大学
IPC: G06F17/27
Abstract: 本申请公开了一种领域语义关系图的文本领域确定方法与系统,包括:对待分析文本进行处理得到语句集合和文本词汇集合;确定所述文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,所述领域语义关系图为根据从网络平台中采集的文本生成的;根据语句集合和领域语义关系图,确定词汇联合得分;根据词汇联合得分和文本词汇得分确定领域总得分;根据所述领域总得分确定所述待分析文本所属的文本领域。根据从网络平台中采集的文本生成的领域语义关系图,通过确定待分析文本中的文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,能够根据需要针对特殊领域对文本进行分析。通过设置语义关联关系、权重系数和专属属性,提高灵活性和针对性。
-
公开(公告)号:CN110232149A
公开(公告)日:2019-09-13
申请号:CN201910385776.2
申请日:2019-05-09
Applicant: 北京邮电大学
IPC: G06F16/9535 , G06F16/33
Abstract: 本申请公开了一种热点事件检测方法和系统,包括:对文本进行预处理、分词和向量化,计算文本相似度矩阵;对文本相似度矩阵进行聚类,得到聚类结果集;提取聚类结果集中的关键词,计算关键词向量之间的距离;判断距离与阈值之间的关系,若小于等于阈值,则输出关键词向量对应的聚类结果,得到融合结果集;输入融合结果集至分类器,得到热点事件关键词和热点事件对应的文本分类器。通过提取聚类结果的关键词,使用词向量对聚类关键词进行向量化表示,判断关键词向量之间的距离,对同一事件的多方向讨论进行归并,提高语义识别程度。使用分类器对融合结果集进行分类,能够在包含固有话题的数据中检测热点事件,提高热点事件的识别准确率。
-
公开(公告)号:CN110263153B
公开(公告)日:2021-04-30
申请号:CN201910403543.0
申请日:2019-05-15
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F40/247 , G06F40/289
Abstract: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
公开(公告)号:CN110263153A
公开(公告)日:2019-09-20
申请号:CN201910403543.0
申请日:2019-05-15
Applicant: 北京邮电大学
Abstract: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
公开(公告)号:CN110222172A
公开(公告)日:2019-09-10
申请号:CN201910403573.1
申请日:2019-05-15
Applicant: 北京邮电大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于改进层次聚类的多源网络舆情主题挖掘方法,涉及主题挖掘领域。具体包括以下步骤:步骤一、获取词向量;步骤二、对所有数据进行预处理;步骤三、对步骤二预处理后总的样本数据句向量化;步骤四、进行句向量半监督层次主题挖掘;步骤五、输出树状图Dendrogram。本发明利用层次聚类算法包含层次信息的优点,并在此基础上从先验知识使用、模型输入向量化、优质主题筛选等角度进行优化,最终使得本文提出的方法能有效适用于主题广泛、文本噪声多、语法缺少规范的多源网络平台短文本的主题挖掘。
-
公开(公告)号:CN103259667B
公开(公告)日:2016-05-18
申请号:CN201310226357.7
申请日:2013-06-07
Applicant: 北京邮电大学
Abstract: 本发明涉及无线通信技术领域,提供了一种移动终端上eID身份认证的方法及系统,包括:eID终端载体,eID客户端和eID统一认证服务系统,eID客户端从eID终端载体获取相关的eID信息;eID客户端与eID统一认证服务系统进行信息交互,进行用户身份验证。本发明传递的信息不包含个人信息,不会造成个人信息的泄漏;采用NFC技术,拓展了eID身份认证的适用场合;整个认证过程中需要两次访问eID统一认证服务系统,增加了系统的安全性,防止了由于浏览器cookies被他人窃取利用所造成的风险。
-
-
-
-
-