-
公开(公告)号:CN106407343B
公开(公告)日:2019-09-13
申请号:CN201610803389.2
申请日:2016-09-06
IPC: G06F16/951
Abstract: 本发明涉及一种NBA赛事新闻的自动生成方法,包括以下步骤:步骤1):解析和存储网站的内容,抽取比赛的基本信息;步骤2):对一节的多条文字直播信息进行预处理,得到该节包含得分信息的文字直播信息集合;步骤3):将该节的文字直播信息集合分为三个数据块;步骤4):从步骤3)中所分出的每一个数据块中抽取重要信息;步骤5):对每一个数据块构建模板,并将所述基本信息和所述重要信息填入模板;步骤6):重复步骤2)‑步骤5),得到所有节的模板并填入基本信息和重要信息。本发明能够生成真实、生动的NBA赛事新闻,大大减轻了新闻工作者的工作负担,提高了新闻工作者的工作效率,可以很好地满足实际应用的需要。
-
公开(公告)号:CN106407343A
公开(公告)日:2017-02-15
申请号:CN201610803389.2
申请日:2016-09-06
IPC: G06F17/30
Abstract: 本发明涉及一种NBA赛事新闻的自动生成方法,包括以下步骤:步骤1):解析和存储网站的内容,抽取比赛的基本信息;步骤2):对一节的多条文字直播信息进行预处理,得到该节包含得分信息的文字直播信息集合;步骤3):将该节的文字直播信息集合分为三个数据块;步骤4):从步骤3)中所分出的每一个数据块中抽取重要信息;步骤5):对每一个数据块构建模板,并将所述基本信息和所述重要信息填入模板;步骤6):重复步骤2)-步骤5),得到所有节的模板并填入基本信息和重要信息。本发明能够生成真实、生动的NBA赛事新闻,大大减轻了新闻工作者的工作负担,提高了新闻工作者的工作效率,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105224689A
公开(公告)日:2016-01-06
申请号:CN201510726507.X
申请日:2015-10-30
Applicant: 北京信息科技大学
IPC: G06F17/30
CPC classification number: G06F16/35
Abstract: 本发明涉及一种东巴文献分类方法,包括以下步骤:步骤1)划分训练集与测试集;步骤2)文本预处理;步骤3)特征选择;步骤4)利用文献特征进行二次降维得到东巴文献分类的特征;步骤5)特征加权;步骤6)用向量空间模型来表示训练集和测试集的文档,得到其向量空间模型表示形式;步骤7)根据分类规则对测试集进行分类得到分类结果。本发明提出的东巴文献分类方法,设计科学合理,工作效率高,利用GMI特征选择算法选择出文本特征,然后结合文献特征进行二次降维得到东巴文献的分类特征,最后利用支持向量机分类器对东巴文献进行训练和测试,平均正确率和召回率都很高,为东巴文献分类提供了一个非常有效的方法。
-
-