基于深度学习的轨道交通事件知识图谱构建方法

    公开(公告)号:CN111597350B

    公开(公告)日:2023-06-02

    申请号:CN202010365826.3

    申请日:2020-04-30

    Abstract: 本发明公开了一种基于深度学习的轨道交通事件知识图谱构建方法;采用词典匹配模式加人工标注方式构建事件识别模型训练数据;采用BERT‑BiLSTM‑CRF算法训练规范事件识别模型,从轨道交通设计规范文本中自动抽取规范条目事件;采用word2vec模型,余弦相似度聚类,逻辑回归二分类模型来对事件识别模型输出的事件进行事件统一;采用snowball算法来构建事件关系模型的训练数据;采用BERT‑BiLSTM‑ATTENTION‑SOFTMAX算法训练关系识别模型,自动抽取事件之间的关系。提升了轨道交通建设设计工程信息化,减少了构建图谱的工作量。

    一种跨域文本分类方法
    2.
    发明公开

    公开(公告)号:CN113626601A

    公开(公告)日:2021-11-09

    申请号:CN202110949647.9

    申请日:2021-08-18

    Abstract: 本发明公开了一种跨域文本分类方法,具体包括如下步骤:步骤1,获取文本信息中的词向量;步骤2,从步骤1获取的词向量中任意选取其中两个词向量,计算两个词向量之间的余弦值,利用余弦值衡量两个词向量间的相似度,并创建相似度矩阵;步骤3,对步骤2所得的相似度矩阵进行降维;步骤4,对步骤3降维后的矩阵进行聚类操作,实现文本分类。采用本发明提供的分类方法,能够提高文本中相关词语的查找率。

    基于Transformer的土木建筑信息领域自然语言问题生成方法

    公开(公告)号:CN112559702B

    公开(公告)日:2022-09-30

    申请号:CN202011249217.8

    申请日:2020-11-10

    Abstract: 本发明公开了基于Transformer的土木建筑信息领域自然语言问题生成方法,本模型通过分析Bert模型中每层学习到的信息分布,结合训练数据的有限特性,对Transformer的不同模块进行不同语料的训练,提出低层网络用于训练句法语法特性,高层网络用于训练获取语义特性的机制。然后,采用UniLM思想对Bert进行下游任务的微调,提升模型在土木建筑信息领域的自然语言文本生成能力。本方法提出的模型在土木建筑信息领域生成问题具有较高的可行性和有效性,并且达到了较高的自然语言问题生成水准。

    基于目录主题分类的轨道交通规范实体识别方法

    公开(公告)号:CN113642330A

    公开(公告)日:2021-11-12

    申请号:CN202110814564.9

    申请日:2021-07-19

    Abstract: 本发明主要是基于目录主题分类的轨道交通规范实体识别方法,采用RoBERTa预训练语言模型以及全词遮盖(Whole Word Masking)机制,通过采集较大规模的建筑规范文本实现领域自适应预训练,并加入主题分类信息,提高命名实体识别任务的性能。另外将训练得到的预训练语言模型应用到命名实体识别任务中,为构建领域知识图谱提供重要支持;会带来很多好处:使命名实体识别模型更好地对领域文本进行表示,提高对于建筑实体的识别性能。逐步增加文本语料库,对已经完成的预训练语言模型进行扩展,从而使预训练语言模型适应更多样多复杂的文本内容;一次训练、多次使用,经过领域自适应预训练的语言模型可以直接应用于其他自然语言处理任务中。

    基于Transformer的土木建筑信息领域自然语言问题生成方法

    公开(公告)号:CN112559702A

    公开(公告)日:2021-03-26

    申请号:CN202011249217.8

    申请日:2020-11-10

    Abstract: 本发明公开了基于Transformer的土木建筑信息领域自然语言问题生成方法,本模型通过分析Bert模型中每层学习到的信息分布,结合训练数据的有限特性,对Transformer的不同模块进行不同语料的训练,提出低层网络用于训练句法语法特性,高层网络用于训练获取语义特性的机制。然后,采用UniLM思想对Bert进行下游任务的微调,提升模型在土木建筑信息领域的自然语言文本生成能力。本方法提出的模型在土木建筑信息领域生成问题具有较高的可行性和有效性,并且达到了较高的自然语言问题生成水准。

    基于深度学习的轨道交通规范关系抽取方法

    公开(公告)号:CN111597420A

    公开(公告)日:2020-08-28

    申请号:CN202010355573.1

    申请日:2020-04-29

    Abstract: 本发明基于深度学习的轨道交通规范关系抽取方法,包括获取带有人工标注的有标签数据,对标签数据进行规范向量表示,将向量化数据输入到GRU模型中进行实体和实体间关系特征提取,对提取的实体和实体间关系进行训练,生成实体识别模型和实体间关系抽取模型,使用Softmax和Cross-Entropy函数结合的方式对提取的实体间关系特征进行关系分类,评估关系分类结果,根据未分类成功的实体间关系优化实体间关系抽取模型,将待检测轨道交通规范语料输入实体间关系抽取模型中,即输出待检测轨道交通规范语料中的实体间关系。采用本方法能够抽取中文轨道交通设计规范中实体间关系,从而提高建筑领域从业人员对轨道交通规范的查询速率。

    一种轻量级的虚拟试验靶场对象模型组件构建方法

    公开(公告)号:CN110705091B

    公开(公告)日:2024-03-15

    申请号:CN201910925114.X

    申请日:2019-09-27

    Abstract: 本发明公开的一种轻量级的虚拟试验靶场对象模型组件构建方法,具体按以下步骤实施:步骤1、基于元模型创建TDL语法支持的UML类图,生成可表征虚拟试验靶场体系中的对象模型的TDL代码;步骤2、构建TDL代码与体系运行平台映射机制,获得抽象的对象模型代码;步骤3、对对象模型代码进行具体业务逻辑代码填充,生成对象模型组件。本发明的对象模型组件构建方法,以解决对象模型构建方法因为客观环境的局限性导致难以完成产品的综合性试验,对比其他对象模型构建技术相比具有快速的、高效、结构简单以及可扩展性高等特点。

    基于Transformer的中文文本信息缺失的补全方法

    公开(公告)号:CN111708882B

    公开(公告)日:2022-09-30

    申请号:CN202010476968.7

    申请日:2020-05-29

    Abstract: 本发明公开了基于Transformer编码器的中文文本信息缺失的补全方法,对待处理的中文文本公开语料的人工预处理,通过计算机识别句号,将文本分割为以句为分割的大量短句语料,短句通过minibatch的方式转变为Bert词向量,产生的词向量将传入SVM进行文本二分类任务,模型将通过训练决定缺失位置的信息补全结果;采用大量遮盖[mask]标签产生的噪声,对模型进行训练,使得模型具有文本的生成能力,对文本缺失信息位置生成机器预测的缺失文本结果;本发明完成对中文文本的信息缺失的检测、信息缺失的补全任务,来帮助中文自然语言处理的文本预处理更加规范,使中文自然语言处理任务准确率进一步提高。

    虚拟试验靶场验证系统的轻量级消息中间件系统及方法

    公开(公告)号:CN111381983B

    公开(公告)日:2022-09-20

    申请号:CN202010151901.6

    申请日:2020-03-06

    Abstract: 本发明公开的一种虚拟试验靶场验证系统的轻量级消息中间件系统,包括有中间件消息转发模块、中间件模型服务模块、中间件时间同步服务模块及对象模型收发模块;本发明的中间件系统,以解决现有虚拟试验靶场试验设备交互难,信息传输慢,消息并发量低等问题。本发明还提供了基于面向消息中间件系统的虚拟试验靶场体系通信方法,具体为:S1:创建可供中间件存储调用的对象模型组件;S2:虚拟试验靶场体系中间件对象模型组件向中间件存储服务器的上传;S3:对对象模型组件进行权限和其他信息绑定;S4:对虚拟试验靶场体系中间件开始前的对象模型组件激活;S5:同步需要互操作设备的时间;S6:进行虚拟设备的信息交互。

    虚拟试验靶场验证系统的轻量级消息中间件系统及方法

    公开(公告)号:CN111381983A

    公开(公告)日:2020-07-07

    申请号:CN202010151901.6

    申请日:2020-03-06

    Abstract: 本发明公开的一种虚拟试验靶场验证系统的轻量级消息中间件系统,包括有中间件消息转发模块、中间件模型服务模块、中间件时间同步服务模块及对象模型收发模块;本发明的中间件系统,以解决现有虚拟试验靶场试验设备交互难,信息传输慢,消息并发量低等问题。本发明还提供了基于面向消息中间件系统的虚拟试验靶场体系通信方法,具体为:S1:创建可供中间件存储调用的对象模型组件;S2:虚拟试验靶场体系中间件对象模型组件向中间件存储服务器的上传;S3:对对象模型组件进行权限和其他信息绑定;S4:对虚拟试验靶场体系中间件开始前的对象模型组件激活;S5:同步需要互操作设备的时间;S6:进行虚拟设备的信息交互。

Patent Agency Ranking