-
公开(公告)号:CN107729414A
公开(公告)日:2018-02-23
申请号:CN201710889249.6
申请日:2017-09-27
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30064 , G06F17/30551 , G06F17/30864
Abstract: 本发明提供了一种展示历史时间轴的知识服务方法、系统及介质,该知识服务方法包括:建立知识库步骤:收集历史上的重要事件和人物的相关介绍以及其他有关历史的信息,从而建立知识库;建立时间轴步骤:利用时间信息抽取技术,对采集得到的历史相关信息进行时间标注,并按照时间先后顺序进行整合、排序;数据可视化步骤:将历史事件和人物的简介资料以幻灯片的形式在时间轴上呈现;搜索功能步骤:用户搜索历史事件、人物或时间后定位到相应的时间轴位置。本发明的有益效果是:本发明能够将大部分的历史的重要事件和人物在时间轴上以幻灯片的形式呈现出来,用户可方便地在时间轴上查看各个历史事件和人物的资料。
-
公开(公告)号:CN104636636B
公开(公告)日:2018-01-05
申请号:CN201510057034.9
申请日:2015-02-02
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及蛋白质远程同源性检测方法及装置,包括训练过程和检测过程;训练过程包括将样本蛋白质作为查询序列输入一组基于排序策略的蛋白质同源性检测的基排序,并在数据库中进行检索,每一个检索结果对应一个同源相似性评分,将所有检索结果降序排序,并组合成特征向量,将得到的特征向量输入基于排序学习的方法中进行训练,得到排序模型;检测过程包括将目标蛋白质按照类似训练过程的方式得到特征向量,输入训练好的排序模型进行排序,得到排序结果,根据排序结果确定目标蛋白质的远程同源性检测结果。本发明通过组合多个基排序的检测结果作为特征向量,然后采用排序学习方法进行训练得到排序模型,从而可以有效提高检测的准确性和稳定性。
-
公开(公告)号:CN107330512A
公开(公告)日:2017-11-07
申请号:CN201710458184.X
申请日:2017-06-16
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明公开一种预测蛋白质序列的远同源性关系的神经网络结构及方法,神经网络结构包括:依次连接的输入层、LSTM层、随时间分布的全连接层和输出层,输入层用于获取输入的原始的蛋白质序列,将原始的蛋白质序列转换为神经网络能够处理的输入矩阵;LSTM层用于捕捉蛋白质序列中子序列间的依赖关系,在每个时间步上输出当前输入子序列的特征;随时间分布的全连接层对LSTM层中的不同memory cell的输出以不同的权重,汇总依赖关系信息;输出层根据随时间分布的全连接层在每个时间步上输出连接而成的向量,预测蛋白质序列的远同源性关系。本发明无需人工构建特征和生成序列谱,节省了大量时间,并提高了预测的准确性。
-
公开(公告)号:CN103823824A
公开(公告)日:2014-05-28
申请号:CN201310314269.2
申请日:2013-11-12
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30864
Abstract: 本发明公开了一种借助互联网自动构建文本分类语料库的方法及系统,该方法包括如下步骤:用户提供所需的文本类别体系,网站结构与内容的采集整理,用户输入类别与网站结构的匹配,语料库去噪,输出语料库。本发明的技术效果是:利用互联网上各类网站上存在的类别标注信息,无需专业的人员手工标注,自适应不同用户的分类体系需求。它改变了传统的语料库构建系统需要大量的具有一定专业知识的人员加入标注的方式,采用对互联网上的丰富信息进行自动的抽取和挖掘的方式,可快速的构建出大容量的精准的文本分类语料库。
-
-
-