一种基于深度学习的文本表示与分类方法

    公开(公告)号:CN108573068A

    公开(公告)日:2018-09-25

    申请号:CN201810409742.8

    申请日:2018-05-02

    Abstract: 本发明涉及一种基于深度学习的文本表示与分类方法,属于自然语言领域。涉及利用深度信念网络DBN、深度波尔茨曼机DBM和卷积神经网络CNN三类深度学习模型,解决文本表示与分类中传统的基于词袋模型BOW文本表示的分类方法存在的高维度、高稀疏和难以处理标签数目不确定、包含大量专业词汇的专业摘要文本问题。本发明充分利用DBM模型自动捕获文本特征对输入文档进行降维、DBN模型抽取高层文档、CNN模型权重共享及局部连接的优势;本发明设计了一个针对文本表示和文本分类的高效模型,具有较高的F测度值、良好ROC曲线和实时性强的优点。

Patent Agency Ranking