一种基于词向量的句子相似度比较方法

    公开(公告)号:CN107844608B

    公开(公告)日:2021-11-30

    申请号:CN201711273188.7

    申请日:2017-12-06

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。

    一种基于词向量的句子相似度比较方法

    公开(公告)号:CN107844608A

    公开(公告)日:2018-03-27

    申请号:CN201711273188.7

    申请日:2017-12-06

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。

    一种基于分布校准的小样本实体关系抽取方法

    公开(公告)号:CN114328921A

    公开(公告)日:2022-04-12

    申请号:CN202111613756.X

    申请日:2021-12-27

    Applicant: 湖南大学

    Inventor: 全哲 彭阳 乐雨泉

    Abstract: 本发明公开了一种基于分布校准的小样本实体关系抽取方法,其假设特征向量中的每个维度都遵循高斯分布,并观察到相似类通常具有相似的特征表示均值和方差。因此,高斯分布的平均值和方差可以在类似的类别之间传递。同时,当有足够的样本时,可以更准确地估计统计数据。因此,重用来自多个类的分布统计量,并根据它们的类相似性可以更好地校准少数类的分布统计量,根据校准后的分布统计量可以生成更多的样本。本发明的有益效果:使提取的特征更丰富;可以减少分散偏度,能够让特征向量分布更接近高斯分布;大大减少了由于数据过少引起的过拟合问题,通过数据增强实现了关系抽取准确度的提高;能够极大地提高模型的泛化能力。

    针对分离约束背包问题的一种协同的并行邻域搜索方法

    公开(公告)号:CN108009013A

    公开(公告)日:2018-05-08

    申请号:CN201711418903.1

    申请日:2017-12-25

    Applicant: 湖南大学

    Inventor: 全哲 叶婷 乐雨泉

    Abstract: 本发明公开了本发明公开了一种针对分离约束背包问题(DCKP)的一种协同的并行邻域搜索方法。本发明采用基于MPI的并行计算模型,能够为并行编程提供灵活的消息传递。我们使用了一种分级的结构,上级线程类似于管理者,用来接收和分发从下级线程传递来的解信息。下级的各个处理线程通过上级联系起来,实现信息的交互。每个下级的处理线程都有不同的基本解和不同于其他线程的搜索策略,很好的实现了局部搜索的多样性,能帮助产生更优的解。另外我们的模型是健壮的,在处理中等规模和大规模实例都有很好的表现。

    一种基于深度学习的药物活性预测方法

    公开(公告)号:CN109033738B

    公开(公告)日:2022-01-11

    申请号:CN201810742486.4

    申请日:2018-07-09

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于深度学习的药物活性预测方法。本发明使用RDkit开源库用于计算给定分子中每个原子的基本特征,包括原子类型,化合价,形式电荷等,只计算原子特征大大减少时间耗费。本发明是结合了图卷积和LSTM两种模型(长短期记忆网络)的预测模型,对于图卷积模型,通过将原子视为节点并将键作为无向图中的边来将所有分子特征化为图,提取分子结构特征,使用图卷积神经网络可以减少时间耗费的同时获取传统方法无法得到的特征。LSTM通过在证据和查询分子之间交换信息来学习复杂的度量。从而达到在低数据量下较高的预测准确度。

    一种基于程序特征分析的迭代编译优化方法

    公开(公告)号:CN107885503B

    公开(公告)日:2021-01-08

    申请号:CN201711113109.6

    申请日:2017-11-11

    Applicant: 湖南大学

    Inventor: 全哲 乐雨泉 林轩

    Abstract: 本发明公开一种基于程序特征分析的迭代编译优化方法,包括如下步骤:步骤一、对编译器中的编译选项按作用进行分类;步骤二、构建关系树形图;步骤三、对目标程序进行数据集测试,收集整理测试结果;步骤四、对测试结果进行分析,提取出目标程序的程序特征和调用关系;步骤五、根据目标程序的程序特征找出对应的编译选项类,组成一个迭代搜索空间;步骤六、在此迭代搜索空间中以类为基础进行局部最优搜索得到全局最优解;步骤七、保存,结束。本发明的方法结合了程序特征分析和局部搜索算法,大大减小了搜索空间的同时也充分考虑了各编译选项之间的影响,对比现有的方法,我们的方法能够在较短时间内找到一个适合目标程序的最优编译选项序列。

    一种基于深度学习的药物活性预测方法

    公开(公告)号:CN109033738A

    公开(公告)日:2018-12-18

    申请号:CN201810742486.4

    申请日:2018-07-09

    Applicant: 湖南大学

    CPC classification number: G06N3/08

    Abstract: 本发明公开了一种基于深度学习的药物活性预测方法。本发明使用RDkit开源库用于计算给定分子中每个原子的基本特征,包括原子类型,化合价,形式电荷等,只计算原子特征大大减少时间耗费。本发明是结合了图卷积和LSTM两种模型(长短期记忆网络)的预测模型,对于图卷积模型,通过将原子视为节点并将键作为无向图中的边来将所有分子特征化为图,提取分子结构特征,使用图卷积神经网络可以减少时间耗费的同时获取传统方法无法得到的特征。LSTM通过在证据和查询分子之间交换信息来学习复杂的度量。从而达到在低数据量下较高的预测准确度。

    一种基于大型系统拓扑结构的容错节点分配方法

    公开(公告)号:CN107908502A

    公开(公告)日:2018-04-13

    申请号:CN201711114201.4

    申请日:2017-11-11

    Applicant: 湖南大学

    CPC classification number: G06F11/1415 G06F11/1458 G06F11/1489

    Abstract: 本发明公开一种基于大型系统拓扑结构的容错节点分配方法,包括如下步骤:步骤一、定义系统拓扑结构中节点位置分布,确定节点的位置;步骤二、建模任意两个节点同时失效的概率模型,从而得到任意两个节点同时失效函数;步骤三、计算任意两点同时失效的概率,得到任意两点同时失效的概率为固定值;步骤四、构建节点分配模型,将计算节点集合抽象成对应的无向加权图G(V,E,W);步骤五、运行覆盖算法,求解最优节点组合,使得集合权值最小,并且将结果保存并返回。本发明相对于传统的节点分配技术,能够使得全系统内存检查点失效概率降低3倍。这也意味着我们能把多级检查点系统中的检查点恢复开销相对于传统做法降低67%。

Patent Agency Ranking