一种非关系型数据库动态混合索引方法

    公开(公告)号:CN110069500A

    公开(公告)日:2019-07-30

    申请号:CN201910327502.8

    申请日:2019-04-23

    Applicant: 东华大学

    Abstract: 本发明一种非关系型数据库动态混合索引方法,其特征在于,包括以下步骤:建立键值对非关系型数据库的非主键索引结构;定义非主键字段的权重,通过一个周期内字段作为查询条件的频次以及字段的历史权重,更新非主键字段的权重值;动态划分索引类型;进行混合索引。本发明提出的键值对非关系型数据库的混合索引方法,可以有效的提升非主键字段的条件查询效率。该方法克服了键值对非关系型数据不支持非主键字段不支持索引查询的弱点,建立了非主键字段的混合索引。在大数据的存储上,即实现了快速查询的功能,又节省了不必要的存储开销。

    基于滑动窗口的可伸缩的大规模流数据顺序特征维持方法

    公开(公告)号:CN109783520A

    公开(公告)日:2019-05-21

    申请号:CN201811597780.7

    申请日:2018-12-26

    Applicant: 东华大学

    Abstract: 本发明提供的一种基于滑动窗口的可伸缩的大规模流数据顺序特征维持方法主要有以下四部分内容:流数据在线处理系统。该处理系统主要由流数据在线处理引擎和摘要查找模块两部分组成。基于固定长度的滑动窗口的流数据摘要方法。基于时间戳的滑动窗口的流数据摘要方法。窗口聚合方法。本发明可以用于在线实时计算数据的顺序特征,在不需要精确查询的时候,能够在极短的时间内回答关于Rank值和分位数的查询。

    低频交易的个体行为建模与欺诈检测方法

    公开(公告)号:CN111242744B

    公开(公告)日:2022-11-11

    申请号:CN202010045152.9

    申请日:2020-01-16

    Applicant: 东华大学

    Abstract: 本发明提出一种低频交易的个体行为建模与欺诈检测方法,首先是低频交易的个体行为建模方法,通过迁移当前交易群体的共性行为去补充低频用户的交易行为。由三个部分组成:一是考虑用户自身仅有的历史交易,结合最佳风险阈值确定算法,构成用户自身交易行为基准;二是通过DBSCAN聚类算法提取出当前所有黑样本与白样本的行为特征,构成当前交易群体共性行为;三是根据历史交易记录,利用滑动窗口机制提取交易变化行为,三者组合构成用户新的交易行为。其次,在此基础之上,提出一种基于朴素贝叶斯模型的检测方法,根据每种行为的结果利用朴素贝叶斯公式计算当前交易属于欺诈的概率,最终确定当前交易是否正常,为解决欺诈交易检测提供了技术支持。

    一种基于动态时间窗的混杂数据流分流量预测方法

    公开(公告)号:CN111291922B

    公开(公告)日:2022-06-21

    申请号:CN202010045151.4

    申请日:2020-01-16

    Applicant: 东华大学

    Abstract: 本发明的目的是:提高混杂数据流中分流量预测的结果。为用户或系统提供更加准确的系统流量信息,并对系统的弹性伸缩提供更为准确的指标参数。为了达到上述目的,本发明的技术方案是提供了一种基于动态时间窗的混杂数据流分流量预测方法。本发明通过结合动态时间窗与皮尔逊相关系数得到基于动态时间窗的权重计算模型,该模型解决了混杂数据流中分流量间的影响对时间变化难以确定的问题。然后通过加入缓存机制解决了基于动态时间窗的权重计算模型可能存在的窗口抖动问题。本发明提出的基于动态时间窗的混杂数据流分流量预测方法,通过改变计算权重时动态时间窗的大小,提高权重的计算准确度,最终提高了最终预测的结果。

    基于特征分化的交易欺诈行为深度检测方法

    公开(公告)号:CN109034194B

    公开(公告)日:2022-03-04

    申请号:CN201810641664.4

    申请日:2018-06-20

    Applicant: 东华大学

    Abstract: 本发明涉及一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,提出了基于交易时间的分化特征生成方法和带有离群样本检测的欺诈交易检测方法。本发明提出的网络交易欺诈检测方法,可以有效检测网络交易中的欺诈行为,本发明提供的方法从实用性角度出发,通过分化特征生成方法和带有离群样本检测的欺诈交易检测方法,建立了网络交易欺诈检测系统,为解决欺诈交易检测提供了技术支持。

    一种混杂数据流分流量峰值预测方法

    公开(公告)号:CN110417577B

    公开(公告)日:2021-11-26

    申请号:CN201910525350.2

    申请日:2019-06-18

    Applicant: 东华大学

    Abstract: 本发明的目的是:提高混杂数据流中分流量峰值预测的结果。为用户或系统提供更加准确的系统流量信息,并对系统的弹性伸缩提供更为准确的指标参数。为了达到上述目的,本发明的技术方案是提供了一种混杂数据流分流量峰值预测模型与方法。本发明提出延迟相关系数模型,在原有的时差相关分析法中引入了滑动时间窗口,可以更有效地计算得到延迟时间与延迟相关系数。本发明提出的混杂数据流分流量峰值预测方法,在原有单一预测模型的结果基础上引入辅助分流量对主分流量的影响,最终提高了最终峰值预测的结果。

    一种基于增量聚类的企业热点事件挖掘方法

    公开(公告)号:CN109145180B

    公开(公告)日:2021-07-20

    申请号:CN201810680294.5

    申请日:2018-06-27

    Applicant: 东华大学

    Abstract: 本发明涉及一种基于增量聚类的企业热点事件挖掘方法,包括以下步骤:通过网络爬虫获取企业网络新闻;对爬取的企业网络新闻进行降噪并存入数据库;从数据库读取企业新闻进行预处理;对预处理后的企业新闻进行聚类分析;对聚类分析得到的热点事件簇进行质心新闻提取并存入数据库;从数据库获取所需企业热点事件并以时间为序进行展示。本发明能够为企业或个人提供企业过去发生的热点事件。

    一种混杂数据流分流量峰值预测方法

    公开(公告)号:CN110417577A

    公开(公告)日:2019-11-05

    申请号:CN201910525350.2

    申请日:2019-06-18

    Applicant: 东华大学

    Abstract: 本发明的目的是:提高混杂数据流中分流量峰值预测的结果。为用户或系统提供更加准确的系统流量信息,并对系统的弹性伸缩提供更为准确的指标参数。为了达到上述目的,本发明的技术方案是提供了一种混杂数据流分流量峰值预测模型与方法。本发明提出延迟相关系数模型,在原有的时差相关分析法中引入了滑动时间窗口,可以更有效地计算得到延迟时间与延迟相关系数。本发明提出的混杂数据流分流量峰值预测方法,在原有单一预测模型的结果基础上引入辅助分流量对主分流量的影响,最终提高了最终峰值预测的结果。

    一种基于时间序列智能预测的企业异动预警方法

    公开(公告)号:CN109740044A

    公开(公告)日:2019-05-10

    申请号:CN201811582052.9

    申请日:2018-12-24

    Applicant: 东华大学

    Abstract: 本发明涉及一种基于时间序列智能预测的企业异动预警方法,包括以下步骤:使用网络爬虫技术获取网络新闻文本以及新闻的发布时间,并进行数据预处理;将数据转化为时间序列,并划分为时间序列段,用来进行时间序列预测;使用时间序列智能预测模型进行时间序列预测;通过文本聚类进行预警信息的挖掘,找到簇的中心文本作为预警新闻。本发明能够通过外部公开的数据解决企业异动预警问题。

Patent Agency Ranking