-
公开(公告)号:CN118147193A
公开(公告)日:2024-06-07
申请号:CN202410104440.5
申请日:2024-01-25
Applicant: 浙江理工大学 , 中南大学 , 浙江清肽生物科技有限公司
Abstract: 本发明公开的是一种酵母中必需基因的鉴定方法,包括如下步骤:构建第一步单交换的质粒;第一步单交换质粒构建完成后将阳性克隆菌株制备感受态;第二步单交换质粒构建;第二步单交换质粒转入第一步单交换菌株感受态细胞中,筛选获得阳性菌株;观察报告基因是否表达,表达则待测基因已成功敲除,若酵母株不再生长则该基因则为必需基因,本发明能够根据报告基因表达及菌株生长情况准确判断该基因是否为必需基因。
-
公开(公告)号:CN109933670B
公开(公告)日:2021-06-04
申请号:CN201910209354.X
申请日:2019-03-19
Applicant: 中南大学
IPC: G06F16/35 , G06F40/30 , G06F40/284
Abstract: 本发明公开了一种基于组合矩阵计算语义距离的文本分类方法,包括步骤:S1、对中文文本进行处理,生成基于词袋模型的向量空间模型;S2、对于全部文本集合,使用生成的词袋模型文本向量作为训练语料,采用word2vec训练词向量,并结合训练出来的词向量和文本向量,构成一个文本矩阵;S3、对文本矩阵进行交叉运算,得到文本之间的语义距离。本发明提出的文本向量的表示和语义距离的计算方法,既克服了传统的词袋模型的缺陷,也改善了TF‑IDF算法的不足,从而可以训练出更好的分类模型来提升文本分类的准确性。
-
公开(公告)号:CN109977285B
公开(公告)日:2023-03-10
申请号:CN201910215453.9
申请日:2019-03-21
Applicant: 中南大学
IPC: G06F16/951 , G06F16/906
Abstract: 本发明公开了一种面向Deep Web的自适应增量数据采集方法,包括以下步骤:步骤1:对给定的结构化的DeepWeb数据源进行多个周期的全量采集;步骤2:利用位于本地数据仓库的初始收集到的数据进行数据源聚类;步骤3:分别统计各个类别中数据源的数量,得到抽样数据源的采样数据;步骤4:对采样数据进行分析预测;步骤5:调度器根据对各数据源s的下载概率的计算,在每个数据采集周期选择平均下载概率最高的类,并调度下载器进行数据下载,将增量更新的结果加入到本地数据仓库;步骤6:在每一个数据采集周期结束后,需要对各次下载结果进行评估(计算的值),用于在步骤4中影响数据源s的采集概率
-
公开(公告)号:CN109977285A
公开(公告)日:2019-07-05
申请号:CN201910215453.9
申请日:2019-03-21
Applicant: 中南大学
IPC: G06F16/951 , G06F16/906
Abstract: 本发明公开了一种面向Deep Web的自适应增量数据采集方法,包括以下步骤:步骤1:对给定的结构化的DeepWeb数据源进行多个周期的全量采集;步骤2:利用位于本地数据仓库的初始收集到的数据进行数据源聚类;步骤3:分别统计各个类别中数据源的数量,得到抽样数据源的采样数据;步骤4:对采样数据进行分析预测;步骤5:调度器根据对各数据源s的下载概率的计算,在每个数据采集周期选择平均下载概率最高的类,并调度下载器进行数据下载,将增量更新的结果加入到本地数据仓库;步骤6:在每一个数据采集周期结束后,需要对各次下载结果进行评估(计算的值),用于在步骤4中影响数据源s的采集概率
-
公开(公告)号:CN109933670A
公开(公告)日:2019-06-25
申请号:CN201910209354.X
申请日:2019-03-19
Applicant: 中南大学
Abstract: 本发明公开了一种基于组合矩阵计算语义距离的文本分类方法,包括步骤:S1、对中文文本进行处理,生成基于词袋模型的向量空间模型;S2、对于全部文本集合,使用生成的词袋模型文本向量作为训练语料,采用word2vec训练词向量,并结合训练出来的词向量和文本向量,构成一个文本矩阵;S3、对文本矩阵进行交叉运算,得到文本之间的语义距离。本发明提出的文本向量的表示和语义距离的计算方法,既克服了传统的词袋模型的缺陷,也改善了TF-IDF算法的不足,从而可以训练出更好的分类模型来提升文本分类的准确性。
-
-
-
-