一种顾及语义的地理信息资源检索意图识别方法

    公开(公告)号:CN114385933A

    公开(公告)日:2022-04-22

    申请号:CN202210280298.0

    申请日:2022-03-22

    Applicant: 武汉大学

    Abstract: 本发明公开了一种顾及语义的地理信息资源检索意图识别方法,包括:1)构建面向地理信息资源检索的意图维度树,并定义意图的形式化表达模型;2)基于相关反馈技术获取反馈样本集合,并计算样本增强系数;3)基于最小描述长度准则设计优化目标函数;4)采用样本随机合并策略生成候选子意图;5)使用贪心算法,调用步骤4)搜索反馈样本编码长度最小的意图,并基于正样本覆盖比例阈值过滤无效子意图,生成意图识别结果;6)基于多次反馈迭代更新意图。本发明利用反馈样本内容语义标签的概念层次关系进行意图识别,并滤除样本中的噪声,具有较高的意图识别准确度及噪声容忍度,可推广应用于各类地理信息门户,提升地理信息共享的服务品质。

    一种地理信息服务元数据文本多层级多标签分类方法

    公开(公告)号:CN110704624B

    公开(公告)日:2021-08-10

    申请号:CN201910942287.2

    申请日:2019-09-30

    Applicant: 武汉大学

    Abstract: 本发明公开了一种地理信息服务元数据文本多层级多标签分类方法,包括:1)获取地理信息服务元数据文本集进行文本预处理,将每条数据样本划分为文本特征词组合;2)设定一级分类目录,生成与分类类别语义关联的典型词词表;3)根据典型词词表对文本特征词进行筛选;4)选取ML‑KNN作为协同训练的一个基模型;5)建立主题预测模型ML‑CSW作为协同训练的另一基模型;6)设计协同机制,为元数据文本匹配多标签主题,作为一级粗粒度主题分类结果;7)选取某一分类标签对应的元数据文本,得到不同级别的细粒度主题类别目录。本发明方法考虑地理信息服务元数据的领域特色和文本语义,仅依赖少量的标记数据样本且分类结果相比传统多标签分类方法整体表现更好。

    一种顾及格网单元属性分级的跨尺度统计指标空间化方法

    公开(公告)号:CN110689055A

    公开(公告)日:2020-01-14

    申请号:CN201910854444.4

    申请日:2019-09-10

    Applicant: 武汉大学

    Abstract: 本发明公开了一种顾及格网单元属性分级的跨尺度统计指标空间化方法,首先在粗粒度行政单元尺度分析待空间化统计指标与多源数据之间的相关性,选取与待空间化统计指标具有较高相关性的数据作为建模辅助数据;然后采用分级方法对各类建模辅助数据的格网统计值进行分级,并确定每一类建模辅助数据的最佳分级数量;接着,在行政单元尺度,构建等级占比特征向量并输入回归模型进行训练;接下来在细粒度格网单元尺度,按照各类辅助数据的最佳等级划分为各格网单元构建特征向量,输入回归模型得到各格网单元的统计指标权重;最后将行政单元内待空间化的统计指标总值按权重分配到各个格网单元中得到最终格网统计值。本发明的方法可以大大提高预测精度。

    一种基于网格的空间多尺度快速聚类方法

    公开(公告)号:CN108537274A

    公开(公告)日:2018-09-14

    申请号:CN201810307824.1

    申请日:2018-04-08

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于网格的空间多尺度快速聚类方法,包括:S1、选择数据尺度,确定网格的尺寸,对样本数据进行网格化,统计各网格的密度值;S2、指定初始密度阈值保留满足阈值条件的所有网格,得到初步的密度矩阵;S3、根据观察尺度指定滤波器模板,对全局网格空间进行卷积操作;S4、通过邻域搜索生成连通区作为初步聚类结果;对网格进行积分操作将网格空间映射到原始点集上得到原始点集聚类结果;S5、调整观察尺度,用变换的新滤波器对结果矩阵重复S3和S4,得到下一个观察尺度的聚类结果;S6、改变数据尺度,重复S1至S5,得到不同数据尺度下的聚类结果。本发明算法复杂度低,聚类效率和精度高,能满足海量点集实时多尺度聚类及可视化分析需求。

Patent Agency Ranking