-
公开(公告)号:CN111325021A
公开(公告)日:2020-06-23
申请号:CN202010097890.8
申请日:2020-02-17
Applicant: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种识别微信公众号所属业态的方法及装置,包括:获取微信公众号的文本数据集,基于所述文本数据集进行BERT模型预训练,得到BERT中文词向量;从所述文本数据集中提取文本特征词,并基于所述BERT中文词向量对所述文本特征词进行向量化,得到字向量序列;将所述字向量序列输入LSTM-CNN模型,得到所述LSTM-CNN模型输出的目标特征向量;将所述目标特征向量输入softmax层,得到所述softmax层输出的概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述微信公众号的所属业态。通过本发明,实现了高精度识别微信公众号的所属业态。