-
公开(公告)号:CN112257429A
公开(公告)日:2021-01-22
申请号:CN202011109749.1
申请日:2020-10-16
Applicant: 北京工商大学
IPC: G06F40/284 , G06F40/216 , G06F40/242 , G06F16/33 , G06F16/35 , G06F16/36
Abstract: 本发明公开了基于BERT‑BTM网络的微博突发事件检测方法,读取微博数据集,对所述微博数据集进行处理,获得原始数据集;将所述原始数据集进行向量化处理,得到向量化处理后的词向量集,然后通过调用预训练BERT模型对所述基础BERT词向量集处理,得到BERT词向量集;构建BERT‑BTM模型,通过所述BERT‑BTM模型对所述原始数据集进行处理;构建BERT‑BTM网络,然后对所述BERT‑BTM网络进行划分,完成突发事件检测。本发明解决了现有微博突发事件检测方法中短文本数据稀疏、无法解决一词多义的问题,并提高了突发事件检测效率。
-
公开(公告)号:CN112257429B
公开(公告)日:2024-04-16
申请号:CN202011109749.1
申请日:2020-10-16
Applicant: 北京工商大学
IPC: G06F40/284 , G06F40/216 , G06F40/242 , G06F16/33 , G06F16/35 , G06F16/36
Abstract: 本发明公开了基于BERT‑BTM网络的微博突发事件检测方法,读取微博数据集,对所述微博数据集进行处理,获得原始数据集;将所述原始数据集进行向量化处理,得到向量化处理后的词向量集,然后通过调用预训练BERT模型对所述基础BERT词向量集处理,得到BERT词向量集;构建BERT‑BTM模型,通过所述BERT‑BTM模型对所述原始数据集进行处理;构建BERT‑BTM网络,然后对所述BERT‑BTM网络进行划分,完成突发事件检测。本发明解决了现有微博突发事件检测方法中短文本数据稀疏、无法解决一词多义的问题,并提高了突发事件检测效率。
-