一种基于多视图的新闻主题挖掘方法

    公开(公告)号:CN115203313A

    公开(公告)日:2022-10-18

    申请号:CN202210814839.3

    申请日:2022-06-20

    Applicant: 江南大学

    Abstract: 本发明公开了一种基于多视图的新闻主题挖掘方法,属于文本分析和数据挖掘的技术领域。本发明首先构建出LT‑MSC模型,然后构造建流形正则化项、稀疏约束项和多样性正则化项,通过引入流形正则化项来挖掘多视图新闻数据中的几何信息,通过使用稀疏约束项来增强子空间表示矩阵的块对角结构,通过融入多样性正则化项来捕获新闻数据中不同视图之间的互补信息。最后,采用谱聚类方法对其进行聚类,相比于现有单视图和多视图挖掘方案,本发明的方法相比于已有的单视图和多视图的挖掘方法,在新闻主题挖掘的场景中能够获得最佳的聚类效果和识别性能,从而有效地提高了新闻主题的挖掘效率和精确率。

Patent Agency Ranking