一种煤矿安全隐患数据的挖掘方法

    公开(公告)号:CN117131108A

    公开(公告)日:2023-11-28

    申请号:CN202311173083.X

    申请日:2023-09-12

    Abstract: 本发明公开一种煤矿安全隐患数据挖掘方法,该方法提出一种Bert‑BiLSTM‑CRF‑GSDMM模型的煤矿安全隐患数据挖掘方法,该方法包括:S1.建立煤矿安全语料标注库:收集煤矿安全事故相关语料,使用BIOES标注法对其标注,生成煤矿安全语料标注库;S2.构建Bert‑BiLSTM‑CRF实体标注模型:使用Python语言构建Bert‑BiLSTM‑CRF模型,用S1生成的煤矿安全语料标注库训练模型。S3.构建GSDMM模型进行聚类分析:使用S2训练好的实体识别模型对煤矿安全隐患语料进行分词,再导入GSDMM模型进行聚类分析,通过K‑means算法轮廓系数确定最优主题个数。Bert‑BiLSTM‑CRF模型能够更好的识别与切分煤矿专有词汇,能够有效的去除因分词不准造成的主题聚类的噪点。GSDMM模型能够更好的对短文本进行聚类分析。

Patent Agency Ranking