微博谣言检测模型训练方法、微博谣言检测方法及装置

    公开(公告)号:CN112749559A

    公开(公告)日:2021-05-04

    申请号:CN202110069648.4

    申请日:2021-01-19

    Abstract: 本发明提供了一种微博谣言检测模型训练方法、微博谣言检测方法及装置,其中,该训练方法包括:获取微博平台的非谣言数据集和谣言数据集;获取所述谣言数据集中谣言数据的发布意图标注信息,并根据发布意图标注信息对所述谣言数据集中的谣言数据进行分类,得到多个不同发布意图类别的谣言数据集;对谣言数据数量较小的发布意图类别的谣言数据进行数据增强,以使各发布意图类别的谣言数据数量均衡;利用谣言数据数量均衡的所有发布意图类别的谣言数据和所述非谣言数据集中的非谣言数据,对设定模型进行训练,得到用于检测非谣言数据和各发布意图类别的谣言数据的微博谣言检测模型。通过上述方案能够准确地检测出发布意图不同的谣言。

    基于分布式处理和DPI数据构建用户网络数据指纹的方法和系统

    公开(公告)号:CN107832333A

    公开(公告)日:2018-03-23

    申请号:CN201710911155.4

    申请日:2017-09-29

    CPC classification number: G06F17/30867 H04L41/5064

    Abstract: 本发明公开了一种基于分布式处理框架和DPI数据的构建用户网络数据指纹的方法和系统,以提取出用户移动端上网行为特征及偏好。该系统包括:数据预处理模块:面向网络数据指纹的需求对原始数据进行清洗和去冗余;规则提取模块:选择M个常用手机APP,抓包得到每个APP的域名并正则匹配,将匹配式作为每个APP的识别规则并形成规则文件;用户集提取模块:提取网络数据指纹系统需要统计的用户集;用户行为提取模块:统计每单位时间段内用户对M个APP的访问情况;数据存储模块:将结果分区保存至数据仓库中,创建索引并备份。本发明通过描述用户移动端上网行为,建立起网络空间和现实生活的对应关系,为分析移动互联网用户行为提供便利,节省空间和时间资源。

    网络流量预测方法、装置、电子设备及存储介质

    公开(公告)号:CN118200167A

    公开(公告)日:2024-06-14

    申请号:CN202410209081.X

    申请日:2024-02-26

    Inventor: 周浩 禹可 吴晓非

    Abstract: 本申请提供一种网络流量预测方法、装置、电子设备及存储介质。该方法包括:获取多个基站之间的地理分布信息以及每个基站对应的网络流量数据;将多个基站分别表示为图结构的节点,将每个基站对应的网络流量数据表示为每个节点对应的节点特征,并将每个基站对应的网络流量数据之间的关联关系表示为边,以根据节点、节点特征和边构建图结构;利用图卷积网络根据图结构提取融合了来自不同节点的转换特征信息;通过预先获取到的历史数据,根据转换特征信息确定状态空间模型的参数估计;根据参数估计通过预先获取的状态转移矩阵确定隐状态信息;利用预先获取的量测方程根据隐状态信息和预先确定的高斯混合模型预测得到下一时刻的网络流量预测数据。

    虚假评论检测模型训练方法、检测方法及电子设备

    公开(公告)号:CN112905739A

    公开(公告)日:2021-06-04

    申请号:CN202110162374.3

    申请日:2021-02-05

    Abstract: 本发明提供了一种虚假评论检测模型训练方法、检测方法及电子设备,该训练方法包括:获取酒店评论数据集;统计酒店信息在评论数据集出现次数得到酒店被评论数量,统计用户信息在酒店评论数据集中出现次数,得到用户发出评论数量;对酒店信息提取酒店属性特征;利用卷积神经网络对评论文本提取评论文本特征;根据用户信息、酒店等级等信息构建用户行为信息,利用DeepFM模型提取用户行为特征;基于注意力机制对用户行为特征、酒店属性特征和评论文本特征进行特征学习得到关联向量,将关联向量融合生成评论特征融合向量;由大量评论特征融合向量形成训练样本集,利用训练样本对分类器训练得到评论检测模型。通过上述方案,能提高虚假评论检测的准确性。

    虚假评论检测模型训练方法、检测方法及装置

    公开(公告)号:CN112463966A

    公开(公告)日:2021-03-09

    申请号:CN202011423884.3

    申请日:2020-12-08

    Abstract: 本发明提供一种虚假评论检测模型训练方法、检测方法及装置,所述训练方法中,基于训练样本集,在词向量库和情绪向量库中检索样本评论文本中的每个单词对应的词向量和情绪向量,将各词向量按照顺序连接成第一输入向量,将各情绪向量按照顺序连接成第二输入向量;初始网络模型利用第一卷积神经网络提取第一输入向量的语义特征向量,利用第二卷积神经网络提取第二输入向量的情绪特征向量,将语义特征向量、情绪特征向量、评论主体特征向量和被评论主体特征向量进行线性连接后,通过全连接层和激活函数进行分类;采用训练样本集对初始网络模型进行训练得到虚假评论检测模型。基于语义特征和情绪特征共同分析,以获得更准确的识别检测效果。

Patent Agency Ranking