基于中文分词技术的蛋白质序列特征提取方法

    公开(公告)号:CN1773517A

    公开(公告)日:2006-05-17

    申请号:CN200510110216.4

    申请日:2005-11-10

    Inventor: 杨旸 吕宝粮

    Abstract: 一种计算机应用技术领域的基于中文分词技术的蛋白质序列特征提取方法,包括以下步骤:(1)根据训练样本中的序列建立词典,找出对分类有用的氨基酸序列子串的集合;(2)切分序列,即对所有样本进行切分,将序列样本与建立好的词典中的词条进行匹配,并选择最优切分方式;(3)切分完毕后进行序列统计,统计每条序列中出现词典中各个词的频率,把序列转化为数值向量;(4)最后用转化好的特征对蛋白质进行分类。本发明提取出的特征可以用于多种蛋白质分类问题,如蛋白质亚细胞定位、结构预测等等。用本发明的方法可提高分类精度,并大幅度减少特征向量的维数。

    计算机自动性别识别的最大最小模块化网络方法

    公开(公告)号:CN1713211A

    公开(公告)日:2005-12-28

    申请号:CN200510027716.1

    申请日:2005-07-14

    Abstract: 一种计算机自动性别识别的最大最小模块化网络方法,用于智能信息处理技术领域。本发明步骤如下:(1)对人脸图像进行特征提取,称为人脸图像特征向量,形成样本集合;(2)将同类性别的样本集合根据年龄信息进行分解,分成不同的子集合;(3)按照M3网络的分解和组合方法对这些子集合进行训练,然后组合成M3网络分类器;(4)最后进行性别识别。本发明可以大弧度地提高性别识别的精度。

    基于主成分分析方法确定超平面的任务分解方法

    公开(公告)号:CN1713210A

    公开(公告)日:2005-12-28

    申请号:CN200510027715.7

    申请日:2005-07-14

    Inventor: 赵海 吕宝粮

    Abstract: 一种用于智能信息处理技术领域的基于超平面划分过程可以用于最小最大模块化分类器的任务分解,使用主成分分析方法来确定该超平面的方向。本发明提出了使用一种简单的排序过程来实现这个超平面划分过程,避免了巨量的聚类算法的时间消耗,同时它有效地保证了分解后产生的分类器组合的精度,避免了以往的随机的样本抽取过程无法保证最终的分类器组合精度的情况。此外,基于超平面划分方法产生的最小最大模块化分类器具有更好的测试性能。

    消除极小极大模块网络冗余的修剪方法

    公开(公告)号:CN1588441A

    公开(公告)日:2005-03-02

    申请号:CN200410066205.6

    申请日:2004-09-09

    Inventor: 连惠城 吕宝粮

    Abstract: 一种用于智能信息处理技术领域的消除极小极大模块网络冗余的修剪方法,利用训练样本的网络输出值来寻找网络中的冗余模块,即由输出值反向地寻找出具有相同输出值的输入模块,这些模块是非冗余的,将其作以标记,训练完毕后没有被标记的模块则是冗余模块,将其删除。本发明提出了一种消除极小极大模块网络冗余的修剪方法,该方法仅仅需要利用训练样本的网络输出值就可以消除网络的冗余模块。该修剪方法在网络训练样本数较大的时候,可以大弧度地降低网络模块的规模。因此可以大大降低网络的空间规模,从而提高网络的运算速度。

Patent Agency Ranking