-
公开(公告)号:CN104951672A
公开(公告)日:2015-09-30
申请号:CN201510346970.1
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
IPC: G06F19/22
Abstract: 本发明涉及生物信息技术和计算生物学领域,特别涉及一种第二代、三代基因组测序数据联用的拼接方法及系统,该方法包括获取第二代基因组测序数据,通过所述第二代基因组测序数据中部分碱基序列reads的质量信息,对所述第二代基因组测序数据进行预处理,构建de Brui jn图;对所述de Brui jn图进行测序错误处理,生成新的de Brui jn图,对所述新的de Brui jn图进行压缩,生成压缩de Brui jn图,获取所述压缩de Brui jn图中压缩边的序列重数;获取第三代基因组测序数据,将所述第三代基因组测序数据回帖到所述第二代基因组测序数据的单分子图gapped fragments上,通过最优排布拆解压缩de Brui jn图,并填充最优排布之间的空隙,以完成基因组测序数据的拼接。
-
公开(公告)号:CN102156693B
公开(公告)日:2013-03-06
申请号:CN201110070320.0
申请日:2011-03-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种盲文输入方法和系统。所述方法包括下列步骤:步骤根据N-gram语言模型,结合汉语盲文分词连写规则,构造盲汉转换模型;根据输入的盲文句子B,列出其对应的所有候选汉语句子S;利用所述盲汉转换模型,求得输入的盲文句子为B时对应的所有候选汉语句子S的概率值P(S|B),取P(S|B)值最大的对应的汉语词串的序列S=s1s2...sm作为最终汉语句子输出。其能够有效利用汉语盲文自身特征,提高盲文转换为汉字的正确率。
-
-
公开(公告)号:CN105718538B
公开(公告)日:2019-05-14
申请号:CN201610030950.8
申请日:2016-01-18
Applicant: 中国科学院计算技术研究所
IPC: G06F16/174 , G06F16/182
Abstract: 本发明提出一种分布式文件系统的自适应压缩方法及系统,涉及分布式系统文件压缩领域,该方法包括步设置压缩文件格式,形成压缩数据流,所述压缩数据流由头部信息与多个数据块组成,其中所述头部信息用于判断所述压缩数据流是否已经过压缩;接收所述待压缩文件,将所述待压缩文件按照所述压缩文件格式将所述待压缩文件进行压缩生成所述压缩数据流;设置索引文件,其中所述索引文件由多个记录组成,每条记录维护所述压缩数据流中数据的数据信息,所述索引文件用于快速定位所述压缩数据流。本发明能够提高压缩效率,节省压缩时间。
-
公开(公告)号:CN104951673B
公开(公告)日:2018-03-30
申请号:CN201510346396.X
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及分子生物学领域的基因组序列拼接领域,本发明提出一种基因组酶切图谱拼接方法及系统,该方法包括对所述基因组酶切图谱中基因序列分子进行预处理操作,获取新基因序列分子,将所述新基因序列分子切成FLES片段,其中所述FLES片段为片段总长固定且无需具有相同酶切位点数目的基因片段;对所述FLES片段进行聚类,生成代表FLES集合,根据所述代表FLES集合对所述基因序列分子进行纠错;根据所述代表FLES集合与纠错后的所述基因序列分子,构建FLES图,对所述FLES图进行路径搜索,获取所述FLES图的汉密尔顿路径为所述基因组的酶切位点序列,以完成基因组酶切图谱拼接。本发明能够快速、准确地构建基因组的酶切位点图谱。
-
公开(公告)号:CN104951672B
公开(公告)日:2017-08-29
申请号:CN201510346970.1
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
IPC: G06F19/22
Abstract: 本发明涉及生物信息技术和计算生物学领域,特别涉及一种第二代、三代基因组测序数据联用的拼接方法及系统,该方法包括获取第二代基因组测序数据,通过所述第二代基因组测序数据中部分碱基序列reads的质量信息,对所述第二代基因组测序数据进行预处理,构建de Brui jn图;对所述de Brui jn图进行测序错误处理,生成新的de Brui jn图,对所述新的de Brui jn图进行压缩,生成压缩de Brui jn图,获取所述压缩de Brui jn图中压缩边的序列重数;获取第三代基因组测序数据,将所述第三代基因组测序数据回帖到所述第二代基因组测序数据的单分子图gapped fragments上,通过最优排布拆解压缩de Brui jn图,并填充最优排布之间的空隙,以完成基因组测序数据的拼接。
-
公开(公告)号:CN104951673A
公开(公告)日:2015-09-30
申请号:CN201510346396.X
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及分子生物学领域的基因组序列拼接领域,本发明提出一种基因组酶切图谱拼接方法及系统,该方法包括对所述基因组酶切图谱中基因序列分子进行预处理操作,获取新基因序列分子,将所述新基因序列分子切成FLES片段,其中所述FLES片段为片段总长固定且无需具有相同酶切位点数目的基因片段;对所述FLES片段进行聚类,生成代表FLES集合,根据所述代表FLES集合对所述基因序列分子进行纠错;根据所述代表FLES集合与纠错后的所述基因序列分子,构建FLES图,对所述FLES图进行路径搜索,获取所述FLES图的汉密尔顿路径为所述基因组的酶切位点序列,以完成基因组酶切图谱拼接。本发明能够快速、准确地构建基因组的酶切位点图谱。
-
公开(公告)号:CN102156693A
公开(公告)日:2011-08-17
申请号:CN201110070320.0
申请日:2011-03-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种盲文输入方法和系统。所述方法包括下列步骤:步骤根据N-gram语言模型,结合汉语盲文分词连写规则,构造盲汉转换模型;根据输入的盲文句子B,列出其对应的所有候选汉语句子S;利用所述盲汉转换模型,求得输入的盲文句子为B时对应的所有候选汉语句子S的概率值P(S|B),取P(S|B)值最大的对应的汉语词串的序列S=s1s2...sm作为最终汉语句子输出。其能够有效利用汉语盲文自身特征,提高盲文转换为汉字的正确率。
-
公开(公告)号:CN105718538A
公开(公告)日:2016-06-29
申请号:CN201610030950.8
申请日:2016-01-18
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30153 , G06F17/30194
Abstract: 本发明提出一种分布式文件系统的自适应压缩方法及系统,涉及分布式系统文件压缩领域,该方法包括步设置压缩文件格式,形成压缩数据流,所述压缩数据流由头部信息与多个数据块组成,其中所述头部信息用于判断所述压缩数据流是否已经过压缩;接收所述待压缩文件,将所述待压缩文件按照所述压缩文件格式将所述待压缩文件进行压缩生成所述压缩数据流;设置索引文件,其中所述索引文件由多个记录组成,每条记录维护所述压缩数据流中数据的数据信息,所述索引文件用于快速定位所述压缩数据流。本发明能够提高压缩效率,节省压缩时间。
-
公开(公告)号:CN202150089U
公开(公告)日:2012-02-22
申请号:CN201120253803.X
申请日:2011-07-18
Applicant: 中国科学院计算技术研究所
Abstract: 本实用新型提供一种盲文点字转换装置,该盲文点字转换装置包括:点字笔、盲文点字阵列单元、ARM微处理器单元、USB2.0 HUB控制器、键盘字符按键装置和键盘编码芯片;其中,盲文点字阵列与ARM微处理器单元连接,ARM微处理器单元通过USB装置与USB2.0 HUB控制器双向连接,键盘字符按键装置与键盘编码芯片双向连接,键盘编码芯片通过USB与USB2.0 HUB控制器双向连接,USB2.0 HUB控制器还用于连接计算机USB设备端口。本实用新型能够以点字输入的方式输入盲文,且能够与现有的盲文应用软件兼容,通用性强;成本低、效率高;即插即用,无需安装驱动,操作简单,方便盲人使用。
-
-
-
-
-
-
-
-
-