-
公开(公告)号:CN107844608B
公开(公告)日:2021-11-30
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06F40/242 , G06F40/211 , G06K9/62
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-
公开(公告)号:CN107844608A
公开(公告)日:2018-03-27
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
CPC classification number: G06F17/30705 , G06F17/271 , G06F17/2735 , G06F17/2775 , G06F17/2785 , G06K9/6215
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-
公开(公告)号:CN117831784A
公开(公告)日:2024-04-05
申请号:CN202410020811.1
申请日:2024-01-08
Applicant: 湖南大学
IPC: G16H50/70 , G16H50/20 , G16H50/30 , G06N3/0442 , G06N3/045 , G06N3/084 , G06N3/096 , G06F18/15 , G06F18/214 , G06F18/21 , G06F18/25 , G06F18/2415 , G06N3/048 , G06F123/02
Abstract: 本发明公开了一种脓毒症多器官功能障碍预测模型结构,将时序数据和非时序数据进行有效整合,使得模型能够充分挖掘患者的病情信息,实现对脓毒症多器官功能障碍的准确预测;然后,本发明提供了脓毒症多器官功能障碍预测模型的训练方法,为了提高模型的性能和泛化能力,本发明还引入了迁移学习方法,利用源域数据集进行预训练,然后在医院数据集上进行微调和验证,以得到最终训练好的脓毒症多器官功能障碍预测模型。本发明能够解决现有脓毒症多器官功能障碍预测模型由于样本量不足以支持复杂模型的训练,导致训练得到的脓毒症多器官功能障碍预测模型在源域数据上表现良好、但在目标域上泛化能力较差的技术问题。
-
公开(公告)号:CN114328921A
公开(公告)日:2022-04-12
申请号:CN202111613756.X
申请日:2021-12-27
Applicant: 湖南大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06K9/62 , G06N20/00
Abstract: 本发明公开了一种基于分布校准的小样本实体关系抽取方法,其假设特征向量中的每个维度都遵循高斯分布,并观察到相似类通常具有相似的特征表示均值和方差。因此,高斯分布的平均值和方差可以在类似的类别之间传递。同时,当有足够的样本时,可以更准确地估计统计数据。因此,重用来自多个类的分布统计量,并根据它们的类相似性可以更好地校准少数类的分布统计量,根据校准后的分布统计量可以生成更多的样本。本发明的有益效果:使提取的特征更丰富;可以减少分散偏度,能够让特征向量分布更接近高斯分布;大大减少了由于数据过少引起的过拟合问题,通过数据增强实现了关系抽取准确度的提高;能够极大地提高模型的泛化能力。
-
公开(公告)号:CN108009013A
公开(公告)日:2018-05-08
申请号:CN201711418903.1
申请日:2017-12-25
Applicant: 湖南大学
Abstract: 本发明公开了本发明公开了一种针对分离约束背包问题(DCKP)的一种协同的并行邻域搜索方法。本发明采用基于MPI的并行计算模型,能够为并行编程提供灵活的消息传递。我们使用了一种分级的结构,上级线程类似于管理者,用来接收和分发从下级线程传递来的解信息。下级的各个处理线程通过上级联系起来,实现信息的交互。每个下级的处理线程都有不同的基本解和不同于其他线程的搜索策略,很好的实现了局部搜索的多样性,能帮助产生更优的解。另外我们的模型是健壮的,在处理中等规模和大规模实例都有很好的表现。
-
公开(公告)号:CN117830274A
公开(公告)日:2024-04-05
申请号:CN202410022015.1
申请日:2024-01-05
Applicant: 湖南大学
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06V10/40 , G06N3/0464 , G06N3/045 , G06N3/084 , G06F40/289 , G06F40/126
Abstract: 本发明公开了一种基于多模态大模型的航空发动机损伤检测方法,首先,通过孔探设备获取发动机内部视频,并抽取关键帧作为分析的图片集合,并将图片经过预处理;其次,构建多模态数据集,数据集由多个部分组成,分别用于训练不同的模型;然后通过使用航空发动机图文数据二次预训练,得到包含航空发动机知识的图片编码器和文本编码器。再使用大规模通用数据集,基于二次预训练的图片编码器和文本编码器,利用对比学习的方法训练多模态大模型;最后使用少量标注的航空发动机损伤图文数据,基于多模态大模型,训练图片微调网络和文本微调网络。本发明能够解决现有人工检测中主观性强、效率低、成本高的技术问题。
-
公开(公告)号:CN109033738B
公开(公告)日:2022-01-11
申请号:CN201810742486.4
申请日:2018-07-09
Applicant: 湖南大学
Abstract: 本发明公开了一种基于深度学习的药物活性预测方法。本发明使用RDkit开源库用于计算给定分子中每个原子的基本特征,包括原子类型,化合价,形式电荷等,只计算原子特征大大减少时间耗费。本发明是结合了图卷积和LSTM两种模型(长短期记忆网络)的预测模型,对于图卷积模型,通过将原子视为节点并将键作为无向图中的边来将所有分子特征化为图,提取分子结构特征,使用图卷积神经网络可以减少时间耗费的同时获取传统方法无法得到的特征。LSTM通过在证据和查询分子之间交换信息来学习复杂的度量。从而达到在低数据量下较高的预测准确度。
-
公开(公告)号:CN107885503B
公开(公告)日:2021-01-08
申请号:CN201711113109.6
申请日:2017-11-11
Applicant: 湖南大学
IPC: G06F8/41
Abstract: 本发明公开一种基于程序特征分析的迭代编译优化方法,包括如下步骤:步骤一、对编译器中的编译选项按作用进行分类;步骤二、构建关系树形图;步骤三、对目标程序进行数据集测试,收集整理测试结果;步骤四、对测试结果进行分析,提取出目标程序的程序特征和调用关系;步骤五、根据目标程序的程序特征找出对应的编译选项类,组成一个迭代搜索空间;步骤六、在此迭代搜索空间中以类为基础进行局部最优搜索得到全局最优解;步骤七、保存,结束。本发明的方法结合了程序特征分析和局部搜索算法,大大减小了搜索空间的同时也充分考虑了各编译选项之间的影响,对比现有的方法,我们的方法能够在较短时间内找到一个适合目标程序的最优编译选项序列。
-
公开(公告)号:CN109033738A
公开(公告)日:2018-12-18
申请号:CN201810742486.4
申请日:2018-07-09
Applicant: 湖南大学
CPC classification number: G06N3/08
Abstract: 本发明公开了一种基于深度学习的药物活性预测方法。本发明使用RDkit开源库用于计算给定分子中每个原子的基本特征,包括原子类型,化合价,形式电荷等,只计算原子特征大大减少时间耗费。本发明是结合了图卷积和LSTM两种模型(长短期记忆网络)的预测模型,对于图卷积模型,通过将原子视为节点并将键作为无向图中的边来将所有分子特征化为图,提取分子结构特征,使用图卷积神经网络可以减少时间耗费的同时获取传统方法无法得到的特征。LSTM通过在证据和查询分子之间交换信息来学习复杂的度量。从而达到在低数据量下较高的预测准确度。
-
公开(公告)号:CN107908502A
公开(公告)日:2018-04-13
申请号:CN201711114201.4
申请日:2017-11-11
Applicant: 湖南大学
IPC: G06F11/14
CPC classification number: G06F11/1415 , G06F11/1458 , G06F11/1489
Abstract: 本发明公开一种基于大型系统拓扑结构的容错节点分配方法,包括如下步骤:步骤一、定义系统拓扑结构中节点位置分布,确定节点的位置;步骤二、建模任意两个节点同时失效的概率模型,从而得到任意两个节点同时失效函数;步骤三、计算任意两点同时失效的概率,得到任意两点同时失效的概率为固定值;步骤四、构建节点分配模型,将计算节点集合抽象成对应的无向加权图G(V,E,W);步骤五、运行覆盖算法,求解最优节点组合,使得集合权值最小,并且将结果保存并返回。本发明相对于传统的节点分配技术,能够使得全系统内存检查点失效概率降低3倍。这也意味着我们能把多级检查点系统中的检查点恢复开销相对于传统做法降低67%。
-
-
-
-
-
-
-
-
-