-
公开(公告)号:CN103345474A
公开(公告)日:2013-10-09
申请号:CN201310223574.0
申请日:2013-07-25
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种文档主题的在线追踪方法,包括如下步骤:首先对数据进行预处理,主要是将数据切分成若干独立段,然后逐段训练以解决内存不足的问题;对数据在主题模型上采用在线学习算法进行训练,其中每段的训练均权重依赖已经训练得到的结果;最后,对每段训练得到的结果进行主题演变分析,对相应的主题进行追踪。本发明采用在线学习算法训练模型的精度和速度都很高,有效的解决了主题模型训练中的一些不足,在海量数据和数据流中表现出较好的鲁棒性。
-
公开(公告)号:CN103345474B
公开(公告)日:2017-02-08
申请号:CN201310223574.0
申请日:2013-07-25
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种文档主题的在线追踪方法,包括如下步骤:首先对数据进行预处理,主要是将数据切分成若干独立段,然后逐段训练以解决内存不足的问题;对数据在主题模型上采用在线学习算法进行训练,其中每段的训练均权重依赖已经训练得到的结果;最后,对每段训练得到的结果进行主题演变分析,对相应的主题进行追踪。本发明采用在线学习算法训练模型的精度和速度都很高,有效的解决了主题模型训练中的一些不足,在海量数据和数据流中表现出较好的鲁棒性。
-