基于文本挖掘和自然语言处理的地质报告文本可视化方法

    公开(公告)号:CN112199926A

    公开(公告)日:2021-01-08

    申请号:CN202011111355.X

    申请日:2020-10-16

    Abstract: 本发明提供了一种基于文本挖掘和自然语言处理的地质报告文本可视化方法;包括首先,利用自然语言处理技术对地质报告进行数据预处理;其次,基于构建的停用词词库对文本中的停用词进行剔除;然后,统计相邻两个词之间共同出现的次数,并生成共现矩阵;最后,进行了词频统计、改进的TF‑IDF关键词提取等,并分别进行了词频统计可视化、关键词词云可视化、中心性分析可视化、多尺度关键词分析可视化等。本发明提出的地质报告文本可视化流程能充分发现和挖掘地质文本隐含的信息,能迅速从可视化结果中获取关键信息,使繁杂的文本信息能以非常直观的形式进行展示。本发明所提出的可视化流程对工程报告类文本具有较高的适用性和参考价值。

    一种基于地理语义词嵌入的城市街道功能识别方法和系统

    公开(公告)号:CN111966770A

    公开(公告)日:2020-11-20

    申请号:CN202010705539.2

    申请日:2020-07-21

    Abstract: 本发明涉及一种基于地理语义词嵌入的城市街道功能识别方法和系统,包括以下步骤:对研究区域内的出租车GPS轨迹数据和城市道路网络数据进行预处理,生成出租车载客轨迹数据和城市街道数据;通过所述城市街道数据和所述出租车载客轨迹数据,生成街道-轨迹语料库;将所述街道-轨迹语料库输入词嵌入模型,无监督训练所述词嵌入模型,训练结束后生成训练好的词嵌入模型;将所述街道-轨迹语料库中的中心街道输入所述训练好的词嵌入模型,生成街道的特征向量。本发明充分考虑车辆GPS轨迹的基本细节和交通街道之间的拓扑关系,可以显著提高分类精度,同时具有鲁棒性和可移植性。

    一种居民地多边形的多级图聚类划分方法

    公开(公告)号:CN107909111B

    公开(公告)日:2020-06-26

    申请号:CN201711191403.9

    申请日:2017-11-24

    Abstract: 本发明提出了一种居民地多边形的多级图聚类划分方法,居民地多边形作为一种重要的面状要素,具有复杂的形状特征和属性特征,为了实现对居民地多边形的聚类分析,本发明立足多边形数据的属性特征,结合空间认知准则和人类认知的特点,首先获取多边形之间的邻接信息,结合五个多边形的相似性度量指标(即:形状狭长度、大小、凹凸性、距离和连通性)对多边形之间的相似性进行度量,接着对相似性数值进行规范化处理和各指标权重的确定,然后使用多级图划分算法对多边形进行聚类,最后使用轮廓系数对聚类结果进行分析评价,使得该方法得到的聚类结果更为客观、可靠。

    一种基于Java的跨平台工作流实现方法及系统

    公开(公告)号:CN110969414A

    公开(公告)日:2020-04-07

    申请号:CN201911180224.4

    申请日:2019-11-27

    Abstract: 本发明涉及工作流技术领域,尤其涉及一种基于Java的跨平台工作流实现方法及系统,其不同之处在于,其步骤包括:S1、功能注册:从Jar包中获取类、接口、方法和参数,并将这些功能方法有选择的注册到功能数据库中,便于实现功能的展示、搜索和功能建模;S2、功能流程搭建;S3、功能流程管理与服务发布:对功能流程模板进行统一管理,提供功能流程模板的导入、导出、编辑、删除功能,实现流程的管理和发布;S4、功能流程服务运行测试;S5、功能流程服务调用:通过功能库web接口调用。本发明可灵活定义业务流程,支持工作流的跨平台搭建。

    基于深度卷积神经网络的遥感影像红树林提取方法及系统

    公开(公告)号:CN110852225A

    公开(公告)日:2020-02-28

    申请号:CN201911058700.5

    申请日:2019-10-31

    Abstract: 本发明公开了一种基于深度卷积神经网络的遥感影像红树林提取方法及系统,本发明首先对高分辨率的遥感影像进行预处理,包括遥感影像的大气校正与研究区域裁剪,对处理后的各波段进行波段运算以提取先验特征信息;应用多源数据融合实现多波段和特征信息的融合,构建数据集;训练并验证由卷积神经网络搭建的语义分类模型ME-net;调用ME-net模型实现红树林的自动分类,输出一个png格式的掩模文件,即为分类和提取的结果;通过长距离条件随机场对分类结果进行细调。本发明中的分类模型在应用中可通过扩展数据集使得分类精度达到92.3%,完全可以代替人工目视解译,为高精度影像地图的更新和滨海地区生态系统的保护提供辅助技术支持。

    一种基于深度学习的无监督地质实体提取方法

    公开(公告)号:CN110457681A

    公开(公告)日:2019-11-15

    申请号:CN201910622537.4

    申请日:2019-07-11

    Abstract: 本发明公开了一种基于深度学习的无监督地质实体提取方法,该模型通过搜集专业领域词汇及词频信息和地质领域实体及词频信息,采用随机抽取及组合的方法利用深度学习模型自动化生成训练语料库;其次,针对自动化构建的语料库采用深度学习模型进行训练;最后通过训练得到的模型来对新输入的地质实体进行识别。与现有技术相比,本发明算法无需人工标注大量的专业领域语料库,能快速扩展到其他专业领域,节省大量人工标注成本。

    空间计算域计算强度特征提取方法

    公开(公告)号:CN105260249B

    公开(公告)日:2019-04-23

    申请号:CN201510600934.3

    申请日:2015-09-19

    Abstract: 本发明公开了一种空间计算域计算强度特征提取方法,该方法包括以下步骤:将影响空间计算域计算强度的因素选取为计算强度候选特征;采集空间计算域的计算样本;对计算样本进行线性回归分析,获得每个计算强度特征的显著性;依次从计算强度候选特征集中剔除显著性最大的计算强度特征;迭代进行线性回归分析,直到每个计算强度特征的显著性均小于目标阈值,最终提取出空间计算域的计算强度特征。本发明基于每个计算强度特征在计算强度线性回归模型中的显著性,依次剔除计算强度线性回归模型中的冗余特征,有效地提取出空间计算域的计算强度特征,为高性能空间计算中空间计算域计算强度的度量奠定了基础。

    一种顾及海岸线地理特征约束的可控分形插值方法及系统

    公开(公告)号:CN106127682B

    公开(公告)日:2019-02-12

    申请号:CN201610417404.X

    申请日:2016-06-15

    Inventor: 江宝得 谢忠 吴亮

    Abstract: 本发明涉及一种顾及海岸线地理特征约束的可控分形插值方法及系统,其方法包括探测海岸线的弯曲特征,并根据海岸线的弯曲特征对海岸线进行划分,得到若干个弯曲单元;利用一维随机中点移位法依次对每个所述弯曲单元进行分形插值,得到若干个与弯曲单元一一对应的分形插值单元曲线,将若干个分形插值单元曲线顺次进行合并,得到完整的海岸线分形插值曲线。本发明的一种顾及海岸线地理特征约束的可控分形插值方法及系统,先将海岸线划分为若干个弯曲单元,然后利用一维随机中点移位法依次对每个所述弯曲单元进行分形插值,既保持了海岸线的分形特征,又很好的顾及了海岸线的地理弯曲特征。

    空间计算域计算强度样本库自动采集方法

    公开(公告)号:CN105260592B

    公开(公告)日:2018-08-07

    申请号:CN201510600367.1

    申请日:2015-09-18

    Abstract: 本发明公开了一种空间计算域计算强度样本库自动采集方法,该方法包括以下步骤:创建空间计算域计算强度样本数据库;选择空间计算类型,获取空间计算域的各个计算参数;给各个计算参数随机赋值,随机生成n个空间计算域;执行空间计算域并计算其执行时间;将计算参数和执行时间作为一条记录新增到计算强度样本库,循环采集n个空间计算域计算强度样本;得到各个空间计算域的计算强度CI;更新样本库中的计算强度值,完成空间计算域计算强度样本的采集。本发明提供了一种空间计算域计算强度样本库自动采集方法,解决了目前手工采集空间计算域计算强度样本效率低、样本数据不准确的难题,为高性能空间计算中空间计算域计算强度的评估奠定了基础。

    基于完全随机森林的矢量空间计算强度预测方法及系统

    公开(公告)号:CN108052755A

    公开(公告)日:2018-05-18

    申请号:CN201711387102.3

    申请日:2017-12-20

    Abstract: 一种基于完全随机森林的矢量空间计算强度预测方法及系统,通过输入与矢量空间计算强度相关的所有特征,训练多棵完全回归决策树,实现对特征复杂多样的矢量空间计算域的计算强度建模,并对完全随机森林的预测结果进行优化,剔除与预测结果偏差较大的预测值,提高完全随机森林的预测精度,有利于在并行计算环境中,对矢量空间计算强度进行精准的预测。本发明在随机森林的训练过程中,每棵回归决策树的训练样本是从原始样本中随机选择的,且选择的特征包括原始样本的全部特征,该模型能够应对重要特征少、冗余特征多的矢量空间计算强度的预测,本发明可以为并行计算资源均衡调度与分配提供依据,提高并行计算效率。

Patent Agency Ranking