一种大规模跨平台基因表达数据分类方法

    公开(公告)号:CN108182347B

    公开(公告)日:2022-02-22

    申请号:CN201810043836.8

    申请日:2018-01-17

    Abstract: 本发明公开了一种大规模跨平台基因表达数据分类方法,包括以下步骤:S1、获取训练集,初始化分类器;S2、对训练集进行数据转换;S3、根据训练集计算相对偏移表;S4、生成候选偏序对,并计算出候选偏序对中的top偏序规则r;S5、更新分类器和训练集;S6、判断样本量与最小支持度θ的大小;S7、设定分类器CL缺省类;S8、预测分类。本发明针对跨平台基因数据挖掘这个问题,通过数据转换,提出了新的偏序对规则挖掘算法和分类模式,可以处理跨平台基因数据的差异性,不仅可以应对更复杂的数据分布,并且通过相对偏移表进行规则预筛选,显著提升了挖掘效率,能够应用于大规模数据上。

    一种基于深度表达的图片素材推荐方法

    公开(公告)号:CN107169031B

    公开(公告)日:2020-05-19

    申请号:CN201710248113.7

    申请日:2017-04-17

    Abstract: 本发明涉及数据挖掘、机器学习及神经网络技术领域,更具体地,涉及一种基于深度表达的图片素材推荐方法,在基于反向传播技术的神经网络模型下,利用Show And Tell技术、Doc2Vec技术及Image2Vec技术对文章及图片进行深度表达处理,并构建一个用于计算文章和图片匹配度的神经网络并对其进行训练和测试,最终得到一个准确率高的计算文章和图片匹配度的神经网络,将一篇文章和多张图片组成多个组合(D,I),将多个组合一一输入该神经网络计算出各个组合的匹配度,即能为该篇文章推荐出匹配度最高的一幅图片,减轻使用者的劳动强度,为使用者带来便利。

    一种基于跨平台基因表达数据的基因调控网络重建方法

    公开(公告)号:CN107016260B

    公开(公告)日:2019-09-13

    申请号:CN201710201797.5

    申请日:2017-03-30

    Abstract: 本发明涉及一种基于跨平台基因表达数据的基因调控网络重建方法,根据跨平台基因表达数据的特点,通过获取来自p个测序平台基因表达数据,并进行预处理,然后从每个基因样本中抽取n个基因表达量,并基于偏相关系数的混合型条件独立性测试得到每个基因表达量的父子节点集,将其应用于跨平台因果网络结构学习的学习网络骨架、确定v‑结构和最大化标志方向三个过程中,从而重建出跨平台基因调控网络,本发明利用因果图模型解决跨平台基因调控网络的问题,能直接有效地利用跨平台基因表达数据进行高维的基因调控网络重建的同时,避免数据预处理过程导致的数据过度平滑等问题,提高了跨平台基因调控网络重建结果的正确率和召回率。

    一种基于深度表达的图片素材推荐方法

    公开(公告)号:CN107169031A

    公开(公告)日:2017-09-15

    申请号:CN201710248113.7

    申请日:2017-04-17

    Abstract: 本发明涉及数据挖掘、机器学习及神经网络技术领域,更具体地,涉及一种基于深度表达的图片素材推荐方法,在基于反向传播技术的神经网络模型下,利用Show And Tell技术、Doc2Vec技术及Image2Vec技术对文章及图片进行深度表达处理,并构建一个用于计算文章和图片匹配度的神经网络并对其进行训练和测试,最终得到一个准确率高的计算文章和图片匹配度的神经网络,将一篇文章和多张图片组成多个组合(D,I),将多个组合一一输入该神经网络计算出各个组合的匹配度,即能为该篇文章推荐出匹配度最高的一幅图片,减轻使用者的劳动强度,为使用者带来便利。

    一种基于SQL语法树节点类型的自然语言生成方法

    公开(公告)号:CN110609849A

    公开(公告)日:2019-12-24

    申请号:CN201910796688.1

    申请日:2019-08-27

    Abstract: 本发明涉及自然语言领域,更具体地,涉及一种基于SQL语法树节点类型的自然语言生成方法。本发明不需要大量的人工操作以及不要求自然语言必须支持多样的句式。与基于序列至序列学习的自然语言生成方法对比,本发明能够获取SQL语言的文本信息,并结合SQL语法树的树状结构化数据以及树状长短期记忆网络使用,更加充分地获取SQL语句的语法结构信息,具有实际的应用意义,避免了人工去查阅开发文档和网上资料的不足,大大降低了时间成本以及人力成本,提高了工作效率。

    一种大规模跨平台基因表达数据分类方法

    公开(公告)号:CN108182347A

    公开(公告)日:2018-06-19

    申请号:CN201810043836.8

    申请日:2018-01-17

    Abstract: 本发明公开了一种大规模跨平台基因表达数据分类方法,包括以下步骤:S1、获取训练集,初始化分类器;S2、对训练集进行数据转换;S3、根据训练集计算相对偏移表;S4、生成候选偏序对,并计算出候选偏序对中的top偏序规则r;S5、更新分类器和训练集;S6、判断样本量与最小支持度θ的大小;S7、设定分类器CL缺省类;S8、预测分类。本发明针对跨平台基因数据挖掘这个问题,通过数据转换,提出了新的偏序对规则挖掘算法和分类模式,可以处理跨平台基因数据的差异性,不仅可以应对更复杂的数据分布,并且通过相对偏移表进行规则预筛选,显著提升了挖掘效率,能够应用于大规模数据上。

    基于基因大数据的小样本基因表达数据分类方法

    公开(公告)号:CN105825078A

    公开(公告)日:2016-08-03

    申请号:CN201610150049.4

    申请日:2016-03-16

    Abstract: 本发明公开了基于基因大数据的小样本基因表达数据分类方法,其技术步骤为:确定训练样本基因表达数据和类标签,构建矩阵;根据L阶频数统计结果和2阶频数统计结果,计算L+1阶估分,去除估分小于阈值的非频繁集;计算到最大阶数Lmax;计算不同类别差异化的缺失情况;对各阶评分表进行排序,建立决策表;根据决策表对测试样本进行判别并输出类别。本发明基于基因大数据的跨平台分类器训练模型,结合基因表达数据公共储存库中海量的数据与小规模基因表达样本混合训练,有效的提高了分类效果。同时,该方法解决了跨平台所带来的缺失值的影响。

    一种基于元-多任务学习的语音情感识别方法及装置

    公开(公告)号:CN112863549A

    公开(公告)日:2021-05-28

    申请号:CN202110077573.4

    申请日:2021-01-20

    Abstract: 本发明涉及一种基于元‑多任务学习的语音情感识别方法及装置。该方法包括:通过将元学习和多任务学习结合起来,学习辅助任务之间的相关性,以及学习辅助任务到主任务的知识迁移能力,其优势主要体现在:对于语音情感识别,考虑情感在连续空间和离散空间的相关性,在支持集上,元学习能够像多任务学习一样学习辅助任务的相关性,同时多任务学习也能够像元学习一样共享学习器。而在查询集上,通过引入知识迁移机制,使得模型能够对主任务和辅助任务间的相关性进行建模。该装置包括:获取单元、数据处理单元、元数据生成单元、初始化单元、元训练单元、元预测微调单元以及元预测识别单元。本发明显著提高了语音情感识别的准确度。

    基于动态图的社交网络节点分类方法

    公开(公告)号:CN111310068A

    公开(公告)日:2020-06-19

    申请号:CN202010165317.6

    申请日:2020-03-11

    Abstract: 本发明公开了基于动态图的社交网络节点分类方法,利用sparsemax函数强化不同节点在时序前后的联系,并结合长短期记忆神经网络使稀疏化处理和细胞的门控共同作用,更好地对时序数据前后联系和依赖关系进行挖掘,充分表达了时序数据中节点状态的变化模式,从而提高社交网络节点分类的精准度。本发明解决了现有的社交网络节点分类方法中,对于社交网络中动态变化的时序数据,无法有效的挖掘节点之间的相互影响和不同时间的前后依赖关系的问题,可用于社交平台,推荐系统,信息系统,医疗健康,影视娱乐等领域中的动态结构社交节点分类问题。

Patent Agency Ranking