-
公开(公告)号:CN106484767B
公开(公告)日:2019-06-21
申请号:CN201610809600.1
申请日:2016-09-08
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种跨媒体的事件抽取方法。本方法为:设置种子事件特征库及所需的知识数据;从可信新闻源中采集新闻网页,并提取新闻文本及元数据信息;从每则新闻文本中抽取事件要素信息,生成一初始事件集合;计算初始事件各要素在事件刻画中的重要程度,生成事件初始概要框架;基于事件初始概要框架中的各要素搜索社交网络消息文本,生成候选消息集合;根据候选消息的概要框架与事件概要框架的相似度对候选消息进行过滤,得到初始事件对应的消息队列;将事件初始概要框架中的事件要素和消息队列中存在而初始概要框架中不存在的事件要素生成完备事件数据。本发明能够在海量跨媒体数据环境中实现重大事件的精确抽取。
-
公开(公告)号:CN106484767A
公开(公告)日:2017-03-08
申请号:CN201610809600.1
申请日:2016-09-08
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F16/3344 , G06F17/2785 , G06Q50/01
Abstract: 本发明公开了一种跨媒体的事件抽取方法。本方法为:设置种子事件特征库及所需的知识数据;从可信新闻源中采集新闻网页,并提取新闻文本及元数据信息;从每则新闻文本中抽取事件要素信息,生成一初始事件集合;计算初始事件各要素在事件刻画中的重要程度,生成事件初始概要框架;基于事件初始概要框架中的各要素搜索社交网络消息文本,生成候选消息集合;根据候选消息的概要框架与事件概要框架的相似度对候选消息进行过滤,得到初始事件对应的消息队列;将事件初始概要框架中的事件要素和消息队列中存在而初始概要框架中不存在的事件要素生成完备事件数据。本发明能够在海量跨媒体数据环境中实现重大事件的精确抽取。
-