-
公开(公告)号:CN113569057A
公开(公告)日:2021-10-29
申请号:CN202110861901.X
申请日:2021-07-29
Applicant: 辽宁大学
Abstract: 本发明涉及一种面向本体标签知识图谱的样例查询方法,属于数据查询及查询优化领域。该方法首先利用本体标签树索引,将实体节点按照本体标签层级进行划分形成树形结构,以便快速确定查询节点候选范围,提高查询效率,更好的体现实体间语义关系及用户的查询意图;通过本体标签树索引形成一级本体标签索引以及d‑邻域信息缩小搜索空间,得到更精确的候选结果集,使查找结果更准确;接着将候选节点集合按相关性公式计算得分并降序排序,便于形成有序的答案集;最后,选取选择性最小的查询节点作为起始节点进行边标签同构匹配,以减少候选匹配代价,通过边标签同构迭代修剪子图,采用有效的双向边索引技术,不必遍历候选节点的所有邻接边即可形成有序的候选结果,提高匹配效率。
-
公开(公告)号:CN106598492B
公开(公告)日:2019-04-09
申请号:CN201611081153.9
申请日:2016-11-30
Applicant: 辽宁大学
IPC: G06F3/06 , G06F16/13 , G06F16/172
Abstract: 本发明涉及一种应用于海量不完整数据的压缩优化方法,包括硬优化方法、软优化方法;该方法通过将海量不完整数据的压缩与传统粗糙理论相集合,并对其中的方法进行改进,利用其对不完整数据压缩过程中的属性进行属性重要性以及属性综合权重进行计算。同时在属性综合权重的基础上设计一种新的不完整数据集中属性值字段的编码方式。该方法提高海量不完整数据的压缩效率,减少海量不完整数据的存储空间,能够在减少冗余的前提下实现海量不完整数据的高效率压缩。它适应于海量不完整数据的减冗余压缩。
-
公开(公告)号:CN113987111B
公开(公告)日:2025-03-07
申请号:CN202111403771.1
申请日:2021-11-24
Applicant: 辽宁大学
IPC: G06F16/31 , G06F40/242 , G06F40/295 , G06F16/903 , G06F16/215 , G06F16/25 , G06F16/27 , G06N3/0455
Abstract: 本发明涉及面向金融领域事件抽取的篇章级长文本数据预处理方法及系统,属于大数据与人工智能技术领域,该方法包括以下步骤:1)选取金融事件的类型,并根据不同的金融事件类型定义事件元素;2)从互联网上公开数据源获取各类金融事件的篇章级长文本类数据,并对文本类数据进行清洗,将清洗后数据格式转换成JSON格式,保存到MongoDB数据库;3)根据不同的金融事件类型进行触发词设定,通过设定的触发词筛选出包含目标金融事件的文本;4)对筛选后的长文本进行数据标注,形成可以训练事件抽取模型的数据集;5)运用构造的数据集训练事件抽取模型,得到的事件抽取结果并检验数据集的效果。本发明通过上述方法,提供了一种发现包含设定类型事件的文本,减少数据标注的成本,为事件抽取提供优质数据集的数据预处理方法及系统。
-
公开(公告)号:CN117763148A
公开(公告)日:2024-03-26
申请号:CN202311791849.0
申请日:2023-12-25
Applicant: 辽宁大学
IPC: G06F16/35 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06Q40/00 , G06F18/2415
Abstract: 基于特征增强的金融新闻事件元素抽取方法及系统,属于数据挖掘领域。具体方法为:步骤1:金融数据集准备;步骤2:建立词嵌入模块;步骤3:多粒度注意力机制模块;步骤4:建立LSTM扩展模块;步骤5:建立门操作模块;建立步骤6:CRF模块,最终通过最大化条件概率,实现事件以及事件元素的结构化输出。本发明通过上述方法及所应用的系统,能够有效抽取特定金融事件类型元素信息,更好的达到应用服务目的。
-
公开(公告)号:CN113569057B
公开(公告)日:2024-03-22
申请号:CN202110861901.X
申请日:2021-07-29
Applicant: 辽宁大学
Abstract: 本发明涉及一种面向本体标签知识图谱的样例查询方法,属于数据查询及查询优化领域。该方法首先利用本体标签树索引,将实体节点按照本体标签层级进行划分形成树形结构,以便快速确定查询节点候选范围,提高查询效率,更好的体现实体间语义关系及用户的查询意图;通过本体标签树索引形成一级本体标签索引以及d‑邻域信息缩小搜索空间,得到更精确的候选结果集,使查找结果更准确;接着将候选节点集合按相关性公式计算得分并降序排序,便于形成有序的答案集;最后,选取选择性最小的查询节点作为起始节点进行边标签同构匹配,以减少候选匹配代价,通过边标签同构迭代修剪子图,采用有效的双向边索引技术,不必遍历候选节点的所有邻接边即可形成有序的候选结果,提高匹配效率。
-
公开(公告)号:CN115935216A
公开(公告)日:2023-04-07
申请号:CN202310023658.3
申请日:2023-01-09
Applicant: 辽宁大学
IPC: G06F18/23213 , G06Q50/02 , G06N3/126 , G06Q10/0635 , G06F18/22
Abstract: 一种面向矿山微震事件预警时间序列的动态矩阵聚类方法。设计方法如下:首先,构建近邻评价体系,根据评价值优劣衡量微震事件的代表性,通过近邻评分的后向差分计算策略构建RDS候选集;其次,提出基于组合优化的RDS选取方法,从候选集上快速得到RDS最优解;最后,动态构建RDS与数据集的距离矩阵,提出基于K‑means的矩阵聚类方法,通过对微震事件波形的聚类,可实现事件的无监督识别,从而定位出冲击地压的发生区域,为煤矿的开采提供安全风险预警。本发明所提方法在聚类可靠性、聚类效率等方面具有明显优势。
-
公开(公告)号:CN115098676A
公开(公告)日:2022-09-23
申请号:CN202210722078.9
申请日:2022-06-24
Applicant: 辽宁大学
Abstract: 一种基于图卷积网络融合注意力机制的文本分类方法,包括以下步骤:步骤1采集样本文本数据,对采集到的样本文本数据进行预处理;步骤2将预处理之后的文本数据进行向量化表示;步骤3构建包含单词节点和文档节点的文本图;步骤4根据特征的重要程度,通过注意力机制对向量化的文本以及文本图的特征赋予权值;步骤5将进行多头自注意力计算之后的文本输入图卷积网络模型,获取各个文本与标签类别之间的关系;步骤6根据所述文本与标签类别之间的关系,获得文本的预测分类结果。本发明通过上述步骤,提供了一种高效、准确、分类效果好的文本分类方法。
-
公开(公告)号:CN114997723A
公开(公告)日:2022-09-02
申请号:CN202210758926.1
申请日:2022-06-30
Applicant: 辽宁大学
IPC: G06Q10/06 , G06F16/27 , G06F16/36 , G06K9/62 , G06F16/35 , G06F16/332 , G06F40/242 , G06F40/295
Abstract: 本发明涉及面向企业经营活动的多源异构区块链质量评估模型的构建方法,该模型首先提出基于CEKGRL模型的实体信息表示方法,在区块链中引入相关实体的三元组结构,并与企业经营活动类别相关联,通过上下文信息进行相似度计算;其次,提出基于信息源、信息评论和信息内容的可信度表征方法,通过融合表征结果,获得经营活动信息的可信度评估;最后,在信息可信度表征基础上,通过价值量对区块链中经营活动信息的总价值进行评估,并构建区块链质量评估模型。该模型在评估区块链块间语义相似度、块内交易信息可信度及价值等方面具有很大优势。
-
公开(公告)号:CN114969571A
公开(公告)日:2022-08-30
申请号:CN202210549014.3
申请日:2022-05-20
Applicant: 辽宁大学
IPC: G06F16/9537 , G06F16/9535 , G06F16/22 , G06F16/2457 , G06F16/2458 , G06F16/29 , G06Q10/04 , G06Q50/26
Abstract: 本发明涉及面向交通路网的时间序列图最优路径查询方法,属于图数据处理领域。本发明将实际路网抽象化,建立交通路网模型,首先定义了时间序列图的概念及特性,将交通路网模型转化为时间序列图;同时基于时间代价和费用代价考虑,引入时间序列图的入边表示方法。其次,针对经典最短路径查询的不足,提出反向搜索策略,有效的提高了交通路网中最优路径查询的效率和准确率;同时针对突发情况,提出了可变阈值最优路径查询方法。
-
公开(公告)号:CN114661832A
公开(公告)日:2022-06-24
申请号:CN202210281261.X
申请日:2022-03-22
Applicant: 辽宁大学
IPC: G06F16/28 , G06F16/25 , G06F16/215 , G06F16/22 , G06F16/27
Abstract: 本发明是一种基于数据质量的多模态异构数据存储方法及系统,包括以下步骤:1)将原始本文数据以key‑value格式在原始数据库中进行分布式存储;2)针对原始多媒体类数据进行数据建模,以文件的形式在文件数据库中进行分布式存储;3)将key‑value数据转换为关系型数据,构建关系数据库;4)根据关系数据库中实体之间的关系构建图数据库;5)将实体的活动数据以链式的结构进行数据建模,构建链式数据库;6)将多媒体数据转换为文本数据,按数据类型分别存储于多媒体数据库及原始数据库;7)通过构建多级索引结构将各个子数据库的实体数据进行链接;8)针对数据集成方法以及各个子数据库构建多模态数据库的日志文件维护体系。该方法可以大大减少查询数据所需的时间,保证相关人员使用数据时的效率。
-
-
-
-
-
-
-
-
-