-
公开(公告)号:CN112131377A
公开(公告)日:2020-12-25
申请号:CN202010808203.9
申请日:2020-08-12
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F16/335 , G06F40/216 , G06F40/30 , G06K9/62 , H04L12/58
Abstract: 本发明公开了一种基于多策略的群聊话题检测方法、装置、设备及存储介质,所述方法包括:根据话题的属性信息得到话题序列,其中,话题序列包括当前话题和过期话题,所述当前话题包括普通话题和热点话题,根据群聊消息的文本特征信息和辅助信息与所述当前话题进行匹配,将群聊消息加入对应的话题中;计算各个话题之间的第一相似度,当所述第一相似度大于等于预设第一阈值时,合并话题。本发明公开的群聊话题检测方法,通过构建话题序列解决了话题交叉的问题,通过利用辅助信息减小短文本特征稀疏对聚类效果的影响,大大提高了群聊话题检测的效率和准确度。
-
公开(公告)号:CN113378565B
公开(公告)日:2022-11-04
申请号:CN202110542573.7
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种多源数据融合的事件分析方法、装置、设备及介质,方法包括:获取第一数据源产生的当前文本,并对当前文本进行预处理得到目标文本;根据历史事件集,判断目标文本是已知事件文本还是未知事件文本;根据事件关键词搜索除第一数据源以外的其他数据源产生的相关文本;根据预设的事件热度预测模型对目标文本进行事件热度预测,得到对应的事件热度值;根据预设的摘要抽取模型对目标文本进行摘要抽取,得到对应的事件摘要;将目标文本及其对应的事件关键词、数据源、相关文本、事件热度值和事件摘要关联存储于历史事件集中。能够从多数据源对热点舆情事件进行检测和追踪,综合多维特征抽取摘要并预测事件热度,分析当前热点舆情事件。
-
公开(公告)号:CN113610080A
公开(公告)日:2021-11-05
申请号:CN202110892160.1
申请日:2021-08-04
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于跨模态感知的敏感图像识别方法、装置、设备及介质,所述方法包括:获取网络社区中待识别的图像信息;将所述图像信息输入预设的敏感图像识别模型中的跨模态感知模块,得到所述图像信息的跨模态文本描述;将所述图像信息的跨模态文本描述输入所述敏感图像识别模型中的敏感信息识别模块,得到含有敏感信息的敏感图像。根据本公开实施例提供的敏感图像识别方法,旨在跨模态表达网络社区图像的语义信息内容,并融合大量网络社区敏感文本内容先验知识,对社区图像的内容进行更准确的分析判别,通过获取图像的跨模态文本描述使得对敏感图像信息的传播及追溯成为可能。
-
公开(公告)号:CN113378565A
公开(公告)日:2021-09-10
申请号:CN202110542573.7
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种多源数据融合的事件分析方法、装置、设备及介质,方法包括:获取第一数据源产生的当前文本,并对当前文本进行预处理得到目标文本;根据历史事件集,判断目标文本是已知事件文本还是未知事件文本;根据事件关键词搜索除第一数据源以外的其他数据源产生的相关文本;根据预设的事件热度预测模型对目标文本进行事件热度预测,得到对应的事件热度值;根据预设的摘要抽取模型对目标文本进行摘要抽取,得到对应的事件摘要;将目标文本及其对应的事件关键词、数据源、相关文本、事件热度值和事件摘要关联存储于历史事件集中。能够从多数据源对热点舆情事件进行检测和追踪,综合多维特征抽取摘要并预测事件热度,分析当前热点舆情事件。
-
公开(公告)号:CN112711948A
公开(公告)日:2021-04-27
申请号:CN202011530521.X
申请日:2020-12-22
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
公开(公告)号:CN110991218A
公开(公告)日:2020-04-10
申请号:CN201910959356.0
申请日:2019-10-10
Applicant: 北京邮电大学
Abstract: 本申请公开了一种基于图像的网络舆情预警系统和方法,包括:信息获取模块获取网络社区中各话题的主题信息和评论信息,发送主题信息至分类与识别模块,发送评论信息至表情分析模块;分类与识别模块分类主题信息中的图像,得到图像类别,提取图像中的文字,将图像类别、图像中的文字与主题信息中的文字发送至预警与得分模块;表情分析模块分析评论信息中的图片,得到评论信息的舆情分析结果,发送至舆情预警模块;预警与得分模块根据图像类别、图像中的文字和主题信息中的文字确定舆情得分,发送至舆情预警模块;舆情预警模块根据舆情分析结果和舆情得分确定预警得分,发出预警。本申请能够准确、快速地发布与图像中的舆情对应的舆情预警。
-
-
-
-
-