-
公开(公告)号:CN108932322A
公开(公告)日:2018-12-04
申请号:CN201810693973.6
申请日:2018-06-29
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于文本大数据的地理语义挖掘方法。本发明采用数据爬取得到带有地理位置标签的文本数据,然后对选取的部分文本数据分配地理语义主题,再将文本数据进行预处理生成词向量,然后再通过机器学习的方式得到所有文本的地理语义主题,最终将所有的地理语义主题以向量的形式输出;本发明根据一个地区的文本数据对该地区的地理语义进行推测,为进一步的城市规划、商业选址、出行规划等提供理论支持和假设;同时本发明的结果还有助于加强人们对某一地区的了解,为人们的出行或游玩规划提供帮助。