-
公开(公告)号:CN112285376A
公开(公告)日:2021-01-29
申请号:CN202011106976.9
申请日:2020-10-16
Applicant: 中国石油大学(华东)
Abstract: 本发明公开了一种基于CNN‑LSTM的风速预测方法,该方法包含:对气象要素的原始记录数据进行清洗;以N个站点的F个气象要素的数据作为输入,通过Z‑score方法对数据进行标准化处理,使其满足(0,1)标准正态分布;利用PCA技术将原始气象要素进行线性组合,转换为一组线性不相关的变量;通过LASSO算法提取影响风速变化的气象要素特征集,将其作为预测模型的输入;通过空间特征提取算法提取目标站点和其相邻站点之间的潜在空间关系,得到T个预报时次上的空间特征向量,结合莫兰指数对风速变化的空间关系进行分析检验;通过时间特征提取算法在T个空间特征向量上提取时间特征关系,并采用Adam算法不断优化;以MAPE作为评估指标,在测试集上验证风速预测的准确率。
-
公开(公告)号:CN110826478A
公开(公告)日:2020-02-21
申请号:CN201911063291.8
申请日:2019-11-01
Applicant: 中国石油大学(华东)
Abstract: 本发明涉及一种基于对抗网络的航拍违建识别方法,属于深度学习中目标检测识别技术领域。本发明为了解决由航拍造成的地面形变场地训练样本少,造成的目标检测器鲁棒性差形变场地难以识别的问题。一般的对抗网络通常是通过对抗性学习训练出一个好的生成器用来逼真的图像,而我们的网络正在完成相反的任务,通过对抗网络竞争,我们希望可以训练一个更好的对变形具有鲁棒性的检测器。通过对抗学习提高识别形变样例的能力,凭借这种对抗性的学习策略,检测的准确性也会随之提升,与标准的Fast-RCNN网络相比在性能方面有了实质性的改进。
-
公开(公告)号:CN110826303A
公开(公告)日:2020-02-21
申请号:CN201911100130.1
申请日:2019-11-12
Applicant: 中国石油大学(华东)
IPC: G06F40/169 , G06F40/279 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于弱监督学习的联合信息抽取方法,属于自然语言处理领域。本发明为了解决基于有监督学习的信息抽取所造成的数据集标注耗时费力,以及双子任务(信息抽取通常分为两个子任务,实体识别和关系抽取)造成的误差传播问题。我们的信息抽取方法通过将信息抽取转化为序列化数据标注的任务,结合知识表示学习方法,采用联合信息抽取的形式,利用公开知识库结合少量数据集,实现弱监督学习联合信息抽取。我们希望训练一个可以对文本进行更准确的信息抽取模型。通过弱监督学习结合联合信息抽取的策略,经过端到端网络的训练,提高信息抽取的准确率和召回率,与当前的信息抽取方法相比在性能方面有了实质性的改进。
-
公开(公告)号:CN110825877A
公开(公告)日:2020-02-21
申请号:CN201911100265.8
申请日:2019-11-12
Applicant: 中国石油大学(华东)
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06F40/247 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于文本聚类的语义相似度分析方法,该方法包含:以未处理的文本数据作为输入,对通过数据预处理的文本进行词频统计,并将词频统计信息作为先验知识加入文本聚类,提出后验判别准则,也可以将词频统计作为分类器再次基础上进行无监督的聚类方法提高文本聚类结果的准确性和时效性;对处理过的文本进行同义词消除歧义、在进行语义角色标注后,生成融合上下文特征的语义向量,采用结构、参数完全相同的两个LSTM处理文本序列,并加入结果的乘积和方差,放大文本的相同点和差异性,计算得到相似度分析的最终结果。本发明的方法能够应用于多种不同领域的文本相似度分析的实际场景中,可以很好地处理类型不同的文本数据。
-
公开(公告)号:CN111008530A
公开(公告)日:2020-04-14
申请号:CN201911217564.X
申请日:2019-12-03
Applicant: 中国石油大学(华东)
IPC: G06F40/30 , G06F40/289 , G06F40/205 , G06F40/242
Abstract: 本发明公开了一种基于文档分词的复杂语义识别方法,该方法包含:将原始文档分成较小的段落,在此基础上进行去除停用词、分段和分句等预处理操作;结合一阶和二阶隐马尔科夫模型,自适应的选取合适的隐马尔科夫模型进行分词,以该模型为基础,再次结合石油领域词典、互信息、语义约束矩阵和语法约束矩阵,实现石油领域专业术语和组合词的精确识别;利用混合策略抽取相关领域的概念术语,通过专业术语、组合词与概念术语建立连续的词袋模型,在词袋模型上采用支持向量机分类器对多个向量进行多特征提取,实现基于文档分词的复杂语义识别。本发明的方法能够有效地解决大数据环境下石油领域内部专业纷繁复杂、深层语义难以识别的问题。
-
-
-
-