一种面向招标文本的信息抽取方法

    公开(公告)号:CN108874771A

    公开(公告)日:2018-11-23

    申请号:CN201810513564.3

    申请日:2018-05-25

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向招标文本的信息抽取方法,包括:对招标文件进行规范化处理;根据所需要抽取的信息,建立对应的关键词列表;逐句读取招标文件的文本内容,使用jieba分词逐句对招标文件的文本进行分词与标注词性处理;将分词结果进行存储,作为后续抽取操作的输入数据,完成预处理;通过调用预设信息抽取模块,根据目标招标信息,对预处理过的文本采用对应匹配抽取方式进行对应的招标信息抽取操作,获取抽取结果。本发明提出的一种面向招标文本的信息抽取方法,利用自然语言处理领域的技术实现对招标文本中特定信息进行抽取并将获得的信息以结构化的形式给予描述。通过对招标文本的信息抽取为招标信息的提取提供更有力的获取工具。

Patent Agency Ranking