-
公开(公告)号:CN114091454A
公开(公告)日:2022-02-25
申请号:CN202111434039.0
申请日:2021-11-29
Applicant: 重庆市地理信息和遥感应用中心
IPC: G06F40/289 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网文本中地名信息提取及空间定位方法,包括步骤:建立地名地址语义库并以其为匹配词典,提取出互联网文本数据中的空间位置信息,实现空间位置信息的定位;利用训练后的Bi‑LSTM‑CRF模型提取经中文分词技术处理后剩余文本数据中的空间位置信息,再利用地理编码技术实现空间位置信息的定位;建立地名地址前后缀特征词语义库,利用关键词匹配方法,从Bi‑LSTM‑CRF模型提取处理后的剩余文本数据中提取可能包含空间位置信息的短语或词语,再利用地理编码实现空间位置信息的定位。其显著效果是:能够有效识别文本中的空间位置信息并定位到不同空间尺度的地理实体或范围,有效提高了空间信息识别的准确率、召回率,具有很高的可操作性。