-
公开(公告)号:CN108573068A
公开(公告)日:2018-09-25
申请号:CN201810409742.8
申请日:2018-05-02
Applicant: 重庆邮电大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于深度学习的文本表示与分类方法,属于自然语言领域。涉及利用深度信念网络DBN、深度波尔茨曼机DBM和卷积神经网络CNN三类深度学习模型,解决文本表示与分类中传统的基于词袋模型BOW文本表示的分类方法存在的高维度、高稀疏和难以处理标签数目不确定、包含大量专业词汇的专业摘要文本问题。本发明充分利用DBM模型自动捕获文本特征对输入文档进行降维、DBN模型抽取高层文档、CNN模型权重共享及局部连接的优势;本发明设计了一个针对文本表示和文本分类的高效模型,具有较高的F测度值、良好ROC曲线和实时性强的优点。