-
公开(公告)号:CN113609306B
公开(公告)日:2024-04-23
申请号:CN202110893417.5
申请日:2021-08-04
Applicant: 北京邮电大学
IPC: G06F16/36 , G06F30/18 , G06F30/27 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N5/022 , G06F111/02
Abstract: 本发明公开了一种对抗残差图变分自编码器的社交网络链接预测方法及系统,包括如下步骤:利用数据采集技术获取某一时刻下的社交网络数据,包括用户的推文数据和用户之间的交互数据;基于用户的交互进行社交网络图结构抽象,其中节点表示社交网络中的真实用户,边表示用户之间的关系;利用Bert模型提取用户推文数据中的内容语义信息,表示成固定长度的向量,作为用户的内容语义;将社交网络图结构和用户的内容语义作为输入,利用批量正则化下的对抗残差图变分自编码器提取拓扑结构特征和语义特征,融合得到低维连续向量空间中的节点表示;两两计算节点向量表示之间的点积,反映节点间的相似度,将高于给定阈值的两个节点认定为会在未来产生链接关系,从而实现社交网络链接预测。
-
公开(公告)号:CN113378565B
公开(公告)日:2022-11-04
申请号:CN202110542573.7
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种多源数据融合的事件分析方法、装置、设备及介质,方法包括:获取第一数据源产生的当前文本,并对当前文本进行预处理得到目标文本;根据历史事件集,判断目标文本是已知事件文本还是未知事件文本;根据事件关键词搜索除第一数据源以外的其他数据源产生的相关文本;根据预设的事件热度预测模型对目标文本进行事件热度预测,得到对应的事件热度值;根据预设的摘要抽取模型对目标文本进行摘要抽取,得到对应的事件摘要;将目标文本及其对应的事件关键词、数据源、相关文本、事件热度值和事件摘要关联存储于历史事件集中。能够从多数据源对热点舆情事件进行检测和追踪,综合多维特征抽取摘要并预测事件热度,分析当前热点舆情事件。
-
公开(公告)号:CN113610080A
公开(公告)日:2021-11-05
申请号:CN202110892160.1
申请日:2021-08-04
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于跨模态感知的敏感图像识别方法、装置、设备及介质,所述方法包括:获取网络社区中待识别的图像信息;将所述图像信息输入预设的敏感图像识别模型中的跨模态感知模块,得到所述图像信息的跨模态文本描述;将所述图像信息的跨模态文本描述输入所述敏感图像识别模型中的敏感信息识别模块,得到含有敏感信息的敏感图像。根据本公开实施例提供的敏感图像识别方法,旨在跨模态表达网络社区图像的语义信息内容,并融合大量网络社区敏感文本内容先验知识,对社区图像的内容进行更准确的分析判别,通过获取图像的跨模态文本描述使得对敏感图像信息的传播及追溯成为可能。
-
公开(公告)号:CN113378565A
公开(公告)日:2021-09-10
申请号:CN202110542573.7
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种多源数据融合的事件分析方法、装置、设备及介质,方法包括:获取第一数据源产生的当前文本,并对当前文本进行预处理得到目标文本;根据历史事件集,判断目标文本是已知事件文本还是未知事件文本;根据事件关键词搜索除第一数据源以外的其他数据源产生的相关文本;根据预设的事件热度预测模型对目标文本进行事件热度预测,得到对应的事件热度值;根据预设的摘要抽取模型对目标文本进行摘要抽取,得到对应的事件摘要;将目标文本及其对应的事件关键词、数据源、相关文本、事件热度值和事件摘要关联存储于历史事件集中。能够从多数据源对热点舆情事件进行检测和追踪,综合多维特征抽取摘要并预测事件热度,分析当前热点舆情事件。
-
公开(公告)号:CN112711948A
公开(公告)日:2021-04-27
申请号:CN202011530521.X
申请日:2020-12-22
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
公开(公告)号:CN109446393B
公开(公告)日:2020-06-30
申请号:CN201811062800.0
申请日:2018-09-12
Applicant: 北京邮电大学
IPC: G06F16/951 , G06F16/332 , G06F16/35 , G06F40/284 , G06Q50/00
Abstract: 本发明公开了一种网络社区话题分类方法及装置,属于数据处理技术领域。所述方法包括:收集网络社区话题语料并确定对应的类别标记,对收集的话题语料进行预处理后作为样本集;根据类别标记和朴素贝叶斯算法构造样本集错分的代价敏感矩阵;基于代价敏感矩阵对样本集进行训练得到分类器;使用分类器对网络社区文本进行分类。本发明中,通过构造代价敏感矩阵,并在分类器的训练过程中,将代价敏感引入随机森林,为各类别加入错分代价,且以错分代价最小为目的进行分类器训练,从而在保证了分类器性能的前提下,有效的解决了由于数据不均衡带来的分类准确率低的问题,进而为网络社区话题的分析和监管提供了有利基础。
-
公开(公告)号:CN110991218A
公开(公告)日:2020-04-10
申请号:CN201910959356.0
申请日:2019-10-10
Applicant: 北京邮电大学
Abstract: 本申请公开了一种基于图像的网络舆情预警系统和方法,包括:信息获取模块获取网络社区中各话题的主题信息和评论信息,发送主题信息至分类与识别模块,发送评论信息至表情分析模块;分类与识别模块分类主题信息中的图像,得到图像类别,提取图像中的文字,将图像类别、图像中的文字与主题信息中的文字发送至预警与得分模块;表情分析模块分析评论信息中的图片,得到评论信息的舆情分析结果,发送至舆情预警模块;预警与得分模块根据图像类别、图像中的文字和主题信息中的文字确定舆情得分,发送至舆情预警模块;舆情预警模块根据舆情分析结果和舆情得分确定预警得分,发出预警。本申请能够准确、快速地发布与图像中的舆情对应的舆情预警。
-
公开(公告)号:CN109446441A
公开(公告)日:2019-03-08
申请号:CN201811126541.3
申请日:2018-09-26
Applicant: 北京邮电大学
IPC: G06F16/955 , G06F16/951
Abstract: 一种通用的网络社区可信分布式采集存储系统,包括:分布式数据采集框架、快速开发框架、可信框架以及数据存储框架,其中,所述分布式数据采集框架采用了多元异构的形式,用于分布式并行的数据采集;所述快速开发框架包括多种快速开发模块,用于实现对系统的快速开发;所述可信框架包括多种性质验证模块,用于实现对数据采集过程中的多种性能的保证以及对存储数据的多种性能进行验证;所述数据存储框架包括多种数据存储模块,用于对多种复杂结构数据进行存储。本发明不但解决了现有爬虫框架中缺乏对数据可信性验证的问题,还针对结构复杂的数据设计了多种存储模块用于实现对其的有效存储;通过快速开发框架,使得开发过程更加方便和快速。
-
公开(公告)号:CN109446393A
公开(公告)日:2019-03-08
申请号:CN201811062800.0
申请日:2018-09-12
Applicant: 北京邮电大学
IPC: G06F16/951 , G06F16/332 , G06F16/35 , G06F17/27 , G06Q50/00
Abstract: 本发明公开了一种网络社区话题分类方法及装置,属于数据处理技术领域。所述方法包括:收集网络社区话题语料并确定对应的类别标记,对收集的话题语料进行预处理后作为样本集;根据类别标记和朴素贝叶斯算法构造样本集错分的代价敏感矩阵;基于代价敏感矩阵对样本集进行训练得到分类器;使用分类器对网络社区文本进行分类。本发明中,通过构造代价敏感矩阵,并在分类器的训练过程中,将代价敏感引入随机森林,为各类别加入错分代价,且以错分代价最小为目的进行分类器训练,从而在保证了分类器性能的前提下,有效的解决了由于数据不均衡带来的分类准确率低的问题,进而为网络社区话题的分析和监管提供了有利基础。
-
-
-
-
-
-
-
-