-
公开(公告)号:CN112863600A
公开(公告)日:2021-05-28
申请号:CN202110388432.4
申请日:2021-04-12
Applicant: 哈尔滨工业大学
Abstract: 一种基于外显子区域插入的数据压缩方法,涉及数据压缩领域。本发明是为了解决现有的数据压缩方法压缩时运行速度慢、压缩适应范围窄、压缩存储量消耗大的问题。本发明包括:对测序短读DNA数据进行预处理获取外显子数据集合;对外显子数据集合进行质控获取异常值并将异常值存储在哈希表中;将哈希表中的异常值进行有序存放;使用霍夫曼编码对存放在哈希表中的异常值中的碱基进行压缩存储;利用LYZip局部解压缩方法判断此时累积插入序列深度是否已经达到30X,如果大于30X则表明无法进行插入压缩;如果小于30X,并且累加上新加入的插入序列仍然小于30X,则重复压缩步骤。本发明用于对数据的压缩。
-
公开(公告)号:CN119763662A
公开(公告)日:2025-04-04
申请号:CN202411842245.9
申请日:2024-12-13
Applicant: 哈尔滨工业大学
IPC: G16B30/10 , G16B40/00 , G06F18/231
Abstract: 一种面向长读长RNA‑seq测序数据的融合基因检测方法,本发明涉及面向长读长RNA‑seq测序数据的融合基因检测方法。本发明的目的是为了解决现有方法在多种人类癌症测序数据上识别融合基因过程计算资源占用过高,识别结果的准确性较低等问题。过程为:一:生成仅含转录本序列的重组参考转录本以及重组转录本注释;二:得到过滤后的测序片段;三:寻找融合基因对;四:得到断点还原后的每个融合基因对;对断点还原后的每个融合基因对的测序片段按照断点位置进行层次聚类,每个聚类簇为融合基因对;五:得到RNA‑seq比对结果;六:根据RNA‑seq比对结果,对四得到的融合基因对进行筛选,获得最终的融合基因对。本发明用于融合基因筛选领域。
-
公开(公告)号:CN110827919B
公开(公告)日:2024-08-09
申请号:CN201911071223.6
申请日:2019-11-05
Applicant: 哈尔滨工业大学
IPC: G16B25/10
Abstract: 本发明提出了一种应用于基因表达谱数据的降维方法,属于计算机应用领域。步骤一:利用回归系数对样本数据矩阵进行“剪枝”,对“剪枝”后的矩阵进行主成分分析,得到主成分Uθ;步骤二:利用回归系数对样本数据矩阵进行“缩放”,对“缩放”后的矩阵进行主成分分析,得到主成分U';步骤三:使用权值α对主成分Uθ和U'进行融合,得到新的主成分X'θ;步骤四:使用主成分X'θ建立分类回归模型,验证降维的效果。本发明解决了现有降维算法在不同特征数量下分类性能不稳定,建立在其上的分类器预测性能比较低的问题,分类效果不理想的问题。
-
公开(公告)号:CN114400750B
公开(公告)日:2024-07-23
申请号:CN202111645498.3
申请日:2021-12-29
Applicant: 哈尔滨工业大学
IPC: H02J7/02 , H02J7/00 , H02M1/15 , H02M7/219 , H02M7/04 , H02M3/155 , H02M3/04 , H02P25/22 , H02P25/16 , H02P25/022 , B60L53/22 , B60L53/24
Abstract: 一种基于九绕组电机的单相两级集成充电系统,属于驱动和充电集成技术领域,为解决将九绕组内置式永磁同步电机及驱动逆变器复用为充电模式下对应的网侧滤波电感和功率变换器的单相单级集成充电系统,母线电压存在二次纹波脉动问题。配置构建基于零序电流注入的两级驱动集成充电系统包括:九相电机绕组和三个并联的三相半桥逆变器构建为逆变拓扑结构,为驱动模式;通过切换开关,将两个三相半桥逆变器配置为三相半桥电路,三相半桥电路和六相电机绕组构建为前级AC/DC变换器,一个三相半桥逆变器和三相电机绕组构建为后级DC/DC变换器,前级AC/DC变换器和后级DC/DC变换器构建为充电拓扑结构,为充电模式。用于驱动和充电系统复用。
-
公开(公告)号:CN115762633B
公开(公告)日:2024-01-23
申请号:CN202211476499.4
申请日:2022-11-23
Applicant: 哈尔滨工业大学
IPC: G16B20/20
Abstract: 一种基于三代测序的基因组结构变异基因型校正方法,涉及生物信息处理领域。本发明是为了解决现有结构变异检测方法还存在由于测序错误噪声、测序深度导致的基因变异检测结果存在误差的问题。本发明包括:获取个体测序数据比对片段,根据比对片段信息提取异常比对片段,并将其划分为比对内部信号和比对间信号,从异常比对片段中提取不同类型的结构变异信号,并获取所有比对片段的起始位置、终止位置、片段名称;获取待分型结构变异,利用待分型结构变异对结构变异信号进行筛选获得支持待分型结构变异的结构变异信号集;利用所有比对片段信息和支持待分型结构变异的结构变异信号集获取待分型结构变异的基因型。本发明用于对结构变异基因型进行校正。
-
公开(公告)号:CN115631789B
公开(公告)日:2023-08-15
申请号:CN202211313819.4
申请日:2022-10-25
Applicant: 哈尔滨工业大学
Abstract: 一种基于泛基因组的群体联合变异检测方法,涉及基因生物学技术领域。本发明是为了解决目前群体联合变异检测方法还存在比对效率低、变异检测灵敏度弱、检测结果不够准确的问题。本发明包括:获取参考基因组和被测样本基因组,并利用参考基因组和被测样本基因组识别被测样本基因组上的候选变异位点,并对候选变异点位进行分类;根据候选变异点位的类型利用候选变异位点构建局部单体型序列,并对构建好的局部单体型序列在样本间整合,获得整合后的单体型序列集合;利用整合后的单体型序列检测被测样本基因组的变异位点的基因型;遍历群体内所有被测样本基因组,并重复执行步骤一到三,获得群体内所有变异基因型。本发明用于群体基因组联合变异检测。
-
公开(公告)号:CN115641911B
公开(公告)日:2023-05-23
申请号:CN202211280417.9
申请日:2022-10-19
Applicant: 哈尔滨工业大学
Abstract: 一种针对序列间重叠检测的方法,具体涉及一种基于第三代测序技术ONT数据的序列间重叠检测的方法,本发明为了解决第三代测序技术在重叠检测时是全部序列进行比对,导致比对速度慢、内存消耗大,且第三代测序技术具有较高的错误率,产生的序列间重叠检测结果准确率不高,可靠性低的问题,它首先将获取的测序序列分为种子序列和映射序列;再构建种子序列的二级哈希索引表;计算种子序列的过滤阈值;最终利用种子序列的二级哈希索引表和过滤阈值将种子序列和映射序列进行比对,得到种子序列和映射序列的重叠信息,再以迭代的方式在每轮迭代开始时重新选取种子序列和映射序列,并重复上述操作,得到测序序列的重叠信息。属于序列重叠检测领域。
-
公开(公告)号:CN115631849B
公开(公告)日:2023-04-28
申请号:CN202211291501.0
申请日:2022-10-19
Applicant: 哈尔滨工业大学
Abstract: 基于深度神经网络的乳腺癌预后指示系统、存储介质及设备,属于癌症预后指示技术领域。本发明为了解决现有的乳腺癌预后预测准确率有待于提高的问题。本发明根据用户输入实例对应的组学特征在TCGA数据库中获取相同的全部乳腺癌实例的组学特征,然后针对每个组学数据分别计算特征的肯德尔相关系数矩阵,根据相关系数矩阵确定全局基因相似系数矩阵及最相近基因相似系数矩阵,并通过迭代计算多组学特征相似性融合矩阵进而获得多组学特征的全局相似性,之后根据非负矩阵分解的方式对其进行分解,根据分解结果对用户取户输入的组学特征进行加权,然后利用机器学习模型进行乳腺癌预后预测。本发明用于乳腺癌的预后指示。
-
公开(公告)号:CN115762633A
公开(公告)日:2023-03-07
申请号:CN202211476499.4
申请日:2022-11-23
Applicant: 哈尔滨工业大学
IPC: G16B20/20
Abstract: 一种基于三代测序的基因组结构变异基因型校正方法,涉及生物信息处理领域。本发明是为了解决现有结构变异检测方法还存在由于测序错误噪声、测序深度导致的基因变异检测结果存在误差的问题。本发明包括:获取个体测序数据比对片段,根据比对片段信息提取异常比对片段,并将其划分为比对内部信号和比对间信号,从异常比对片段中提取不同类型的结构变异信号,并获取所有比对片段的起始位置、终止位置、片段名称;获取待分型结构变异,利用待分型结构变异对结构变异信号进行筛选获得支持待分型结构变异的结构变异信号集;利用所有比对片段信息和支持待分型结构变异的结构变异信号集获取待分型结构变异的基因型。本发明用于对结构变异基因型进行校正。
-
公开(公告)号:CN115641955A
公开(公告)日:2023-01-24
申请号:CN202211280416.4
申请日:2022-10-19
Applicant: 哈尔滨工业大学
Abstract: 基于深度学习的胃癌分期判别系统及存储介质,属于癌症辅助判识技术领域。本发明为了解决现有的胃癌分期判别准确率低的问题,本发明首先通过组学特征相关系数计算单元对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,并得到组学特征矩阵;然后通过胃癌标记基因筛选单元:计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,并与用户输入的原始数据加权,得到特征矩阵Sq*r;胃癌分期预测单元基于该特征矩阵,利用神经网络对胃癌分期进行预测。本发明用于胃癌的分期判别。
-
-
-
-
-
-
-
-
-