-
公开(公告)号:CN112257429A
公开(公告)日:2021-01-22
申请号:CN202011109749.1
申请日:2020-10-16
Applicant: 北京工商大学
IPC: G06F40/284 , G06F40/216 , G06F40/242 , G06F16/33 , G06F16/35 , G06F16/36
Abstract: 本发明公开了基于BERT‑BTM网络的微博突发事件检测方法,读取微博数据集,对所述微博数据集进行处理,获得原始数据集;将所述原始数据集进行向量化处理,得到向量化处理后的词向量集,然后通过调用预训练BERT模型对所述基础BERT词向量集处理,得到BERT词向量集;构建BERT‑BTM模型,通过所述BERT‑BTM模型对所述原始数据集进行处理;构建BERT‑BTM网络,然后对所述BERT‑BTM网络进行划分,完成突发事件检测。本发明解决了现有微博突发事件检测方法中短文本数据稀疏、无法解决一词多义的问题,并提高了突发事件检测效率。
-
公开(公告)号:CN112256941A
公开(公告)日:2021-01-22
申请号:CN202011123548.7
申请日:2020-10-20
Applicant: 北京工商大学
IPC: G06F16/951 , G06F16/906 , G06Q50/00
Abstract: 本发明公开一种基于局部信息的社交网络重构方法,步骤一:数据预处理;步骤二:根据节点属性和网络拓扑结构添加占位符节点;所述的占位符节点是为了定位缺失点而存在的一种临时性节点;步骤三:对步骤二所添加的占位符节点进行聚类,用以确定缺失点的具体数目和位置,消除多余的占位符节点,增加网络重构准确性;步骤四:使用链路预测算法确定网络中的缺失边;步骤五:根据上述步骤的处理结果重新构建网络结构。本发明方法可以有效的确定缺失点的位置,并且先解决缺失点的问题可以很好的为后续缺失边的补足做有效支撑,提高预测准确性;可使得舆情传播的相关研究更加高效,有效控制不良舆情传播造成的严重影响和危害。
-
公开(公告)号:CN112256941B
公开(公告)日:2023-10-13
申请号:CN202011123548.7
申请日:2020-10-20
Applicant: 北京工商大学
IPC: G06F16/951 , G06F16/906 , G06Q50/00
Abstract: 本发明公开一种基于局部信息的社交网络重构方法,步骤一:数据预处理;步骤二:根据节点属性和网络拓扑结构添加占位符节点;所述的占位符节点是为了定位缺失点而存在的一种临时性节点;步骤三:对步骤二所添加的占位符节点进行聚类,用以确定缺失点的具体数目和位置,消除多余的占位符节点,增加网络重构准确性;步骤四:使用链路预测算法确定网络中的缺失边;步骤五:根据上述步骤的处理结果重新构建网络结构。本发明方法可以有效的确定缺失点的位置,并且先解决缺失点的问题可以很好的为后续缺失边的补足做有效支撑,提高预测准确性;可使得舆情传播的相关研究更加高效,有效控制不良舆情传播造成的严重影响和危害。
-
公开(公告)号:CN112257429B
公开(公告)日:2024-04-16
申请号:CN202011109749.1
申请日:2020-10-16
Applicant: 北京工商大学
IPC: G06F40/284 , G06F40/216 , G06F40/242 , G06F16/33 , G06F16/35 , G06F16/36
Abstract: 本发明公开了基于BERT‑BTM网络的微博突发事件检测方法,读取微博数据集,对所述微博数据集进行处理,获得原始数据集;将所述原始数据集进行向量化处理,得到向量化处理后的词向量集,然后通过调用预训练BERT模型对所述基础BERT词向量集处理,得到BERT词向量集;构建BERT‑BTM模型,通过所述BERT‑BTM模型对所述原始数据集进行处理;构建BERT‑BTM网络,然后对所述BERT‑BTM网络进行划分,完成突发事件检测。本发明解决了现有微博突发事件检测方法中短文本数据稀疏、无法解决一词多义的问题,并提高了突发事件检测效率。
-
-
-