-
公开(公告)号:CN109558424A
公开(公告)日:2019-04-02
申请号:CN201811304324.9
申请日:2018-11-03
Applicant: 复旦大学
IPC: G06F16/2455 , G06K9/62
CPC classification number: G06K9/6268 , G06K9/6218
Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。
-
公开(公告)号:CN112802547B
公开(公告)日:2022-09-20
申请号:CN202110119134.5
申请日:2021-01-28
Applicant: 复旦大学
Abstract: 本发明公开了一种基因检测方法,实现了检验导致某种特定特点的因果基因。现有的对因果基因的鉴别往往离不开独立性检验,传统的独立性检验随着数据维度的增加复杂度呈指数增加,故传统的独立性检验在数据具备高纬度特点的生物科学领域受到较大限制,因此本发明利用一种基于线性回归独立性检验策略替代传统的独立性检验,能够高效准确地找出因果基因。和其他因果基因鉴别领域的方法比较之下,均有着突出的表现,能够更准确的找出更多的因果基因。
-
公开(公告)号:CN109558424B
公开(公告)日:2023-04-18
申请号:CN201811304324.9
申请日:2018-11-03
Applicant: 复旦大学
IPC: G06F16/2455 , G06F18/241 , G06F18/23
Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。
-
公开(公告)号:CN112802547A
公开(公告)日:2021-05-14
申请号:CN202110119134.5
申请日:2021-01-28
Applicant: 复旦大学
Abstract: 本发明公开了一种基因检测方法,实现了检验导致某种特定特点的因果基因。现有的对因果基因的鉴别往往离不开独立性检验,传统的独立性检验随着数据维度的增加复杂度呈指数增加,故传统的独立性检验在数据具备高纬度特点的生物科学领域受到较大限制,因此本发明利用一种基于线性回归独立性检验策略替代传统的独立性检验,能够高效准确地找出因果基因。和其他因果基因鉴别领域的方法比较之下,均有着突出的表现,能够更准确的找出更多的因果基因。
-
-
-