-
-
公开(公告)号:CN105589953A
公开(公告)日:2016-05-18
申请号:CN201510964759.6
申请日:2015-12-21
Applicant: 南通大学
IPC: G06F17/30
CPC classification number: G06F16/9577 , G06F16/955
Abstract: 本发明公开了一种突发公共卫生事件互联网文本抽取方法,包括筛选作为对突发公共卫生事件信息进行挖掘的社会媒体,对筛选后的社会媒体进行分类,对于不同类别的社会媒体按照不同的方式进行文本抓取,以及将抓取的结果存入数据库。本方法充分考虑了不同社会媒体的不同特点,根据这些不同特点制定不同的信息抓取策略,从而实现了提高信息抓取速度、增进抓取信息的准确度,因此能够在第一时间收集突发公共卫生事件的舆情,对突发公共卫生事件的做出预警,此外还可供公共管理部门监测舆情使用。
-
公开(公告)号:CN104573009A
公开(公告)日:2015-04-29
申请号:CN201510010013.1
申请日:2015-01-08
Applicant: 南通大学
CPC classification number: G06F16/93 , G06F17/2705 , G06N5/02
Abstract: 本发明公开了一种领域知识库属性扩展的方法,包括建立属性要素框架,再通过参考《同义词词林》扩展属性词,从而作为种子集合。将已有的、并且词性标注和经过Gate标注的属性信息作为种子属性集合,设计种子模式,选择与种子模式匹配的内容信息,将这些特征词按照给定的文本模式结构进行模式化表示,从而生成新的文本模式,再用这些自动获取的文本模式来抽取新的特征属性,并将新的特征属性加入属性特征种子集合,不断重复这段过程从而完善扩充属性信息,本发明能提高领域知识库属性扩展覆盖面和精确度,进而提高领域知识库的质量,同时该方法简单高效。
-
公开(公告)号:CN104573009B
公开(公告)日:2018-08-24
申请号:CN201510010013.1
申请日:2015-01-08
Applicant: 南通大学
Abstract: 本发明公开了一种领域知识库属性扩展的方法,包括建立属性要素框架,再通过参考《同义词词林》扩展属性词,从而作为种子集合。将已有的、并且词性标注和经过Gate标注的属性信息作为种子属性集合,设计种子模式,选择与种子模式匹配的内容信息,将这些特征词按照给定的文本模式结构进行模式化表示,从而生成新的文本模式,再用这些自动获取的文本模式来抽取新的特征属性,并将新的特征属性加入属性特征种子集合,不断重复这段过程从而完善扩充属性信息,本发明能提高领域知识库属性扩展覆盖面和精确度,进而提高领域知识库的质量,同时该方法简单高效。
-
公开(公告)号:CN104573006A
公开(公告)日:2015-04-29
申请号:CN201510009769.4
申请日:2015-01-08
Applicant: 南通大学
IPC: G06F17/30
CPC classification number: G06F17/30289
Abstract: 本发明涉及一种公共卫生突发事件领域知识库的构建方法。包括如下步骤:分析公共卫生突发事件生命周期所涉及的各个领域,搜集相关文档,获得语料库;通过提取句子中属性信息,构建事件框架;对文本信息进行处理,形成标准的信息标注体系;将已经得到的属性信息作为种子属性,并设计种子模式,依靠这些种子信息去选择新的与之匹配的相关信息,得到更多属性信息;利用属性信息,构建公共卫生突发事件领域本体。本发明的领域知识库构建方法构建的公共卫生突发事件领域知识库,更加准确和全面,简单高效,有助于生成和执行新的应急预案,这不仅为突发事件的应急处理提供了标准参考,还能够提高应急处理的效率,为之后的科研工作提供了参考。
-
-
-
-