一种文档主题的在线追踪方法

    公开(公告)号:CN103345474A

    公开(公告)日:2013-10-09

    申请号:CN201310223574.0

    申请日:2013-07-25

    Applicant: 苏州大学

    Abstract: 本发明公开了一种文档主题的在线追踪方法,包括如下步骤:首先对数据进行预处理,主要是将数据切分成若干独立段,然后逐段训练以解决内存不足的问题;对数据在主题模型上采用在线学习算法进行训练,其中每段的训练均权重依赖已经训练得到的结果;最后,对每段训练得到的结果进行主题演变分析,对相应的主题进行追踪。本发明采用在线学习算法训练模型的精度和速度都很高,有效的解决了主题模型训练中的一些不足,在海量数据和数据流中表现出较好的鲁棒性。

    一种文档主题的在线追踪方法

    公开(公告)号:CN103345474B

    公开(公告)日:2017-02-08

    申请号:CN201310223574.0

    申请日:2013-07-25

    Applicant: 苏州大学

    Abstract: 本发明公开了一种文档主题的在线追踪方法,包括如下步骤:首先对数据进行预处理,主要是将数据切分成若干独立段,然后逐段训练以解决内存不足的问题;对数据在主题模型上采用在线学习算法进行训练,其中每段的训练均权重依赖已经训练得到的结果;最后,对每段训练得到的结果进行主题演变分析,对相应的主题进行追踪。本发明采用在线学习算法训练模型的精度和速度都很高,有效的解决了主题模型训练中的一些不足,在海量数据和数据流中表现出较好的鲁棒性。

Patent Agency Ranking