基于Transformer的上下文感知单步逆合成预测方法和装置

    公开(公告)号:CN115798621A

    公开(公告)日:2023-03-14

    申请号:CN202211467767.6

    申请日:2022-11-22

    Abstract: 本发明公开了一种基于Transformer的上下文感知单步逆合成预测方法和装置,包括:在合成路径搜索树中搜索从目标分子到选定分子的上下文路径;编码上下文路径中化学反应模板相关的上下文分子信息以得到获取上下文反应表征向量序列,同时编码选定分子以得到选定分子的深层次语义特征向量;利用Transformer模型对上下文反应表征向量序列与深层次语义特征向量的拼接结果进行编码,以得到融合上下文信息的分子表征向量;利用分类器对分子表征向量进行候选化学反应模板预测,依据化学反应模板预测结果筛选排序高的候选化学反应模板应用于选定分子到目标分子的单步逆合成。该方法和装置提升分子化学反应模板预测的准确性。

    一种融合知识图谱的检索式知识前缀引导视觉问答方法

    公开(公告)号:CN115761753A

    公开(公告)日:2023-03-07

    申请号:CN202211200419.2

    申请日:2022-09-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种融合知识图谱的检索式知识前缀引导视觉问答方法,包括:构建的背景知识库包含有标注的知识数据,该知识数据利用视觉问答过程中的知识召回。在此基础上,通过基于词干匹配的检索器检索构建知识文本序列对图像编码器和阅读器进行初训练,以在阅读器中引入知识,然后通过孪生检索器对图像编码器和阅读器进行再训练,以增强阅读器对知识的感知,这种基于背景知识库配合检索器和阅读器的协同工作,提升考虑外部知识的视觉问答的准确性。

    结合语义的网络故障关联规则生成方法和网络故障检测方法

    公开(公告)号:CN112100369B

    公开(公告)日:2022-06-10

    申请号:CN202010744548.2

    申请日:2020-07-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种结合语义的网络故障关联规则生成方法,包括:(1)根据网络设备和告警信息以及关联关系构建网络知识图谱;(2)构建并优化词表,根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示;(3)构建实现自动编码和解码的图神经网络,以节点的初始向量表示作为图神经网络的输入,以解码得到的重构图作为输出,根据重构图与输入图之间的距离值、编码得到的节点的向量表示分布与正态分布的散度值构建损失函数,利用损失函数优化节点的向量表示;(4)根据节点的优化后向量表示,计算任意两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。该公开了一种结合语义的网络故障检测方法。

    一种基于对比学习的分子图表示学习方法

    公开(公告)号:CN112669916B

    公开(公告)日:2022-03-15

    申请号:CN202011564310.8

    申请日:2020-12-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对比学习的分子图表示学习方法,包括:获取每个分子的分子指纹表示,计算每两个分子指纹之间的相似度;收集全量的化学官能团信息,为分子中的每个原子匹配对应的官能团;用异构图对分子图建模;利用结构感知分子编码器中的RGCN编码分子中每个原子的表示及其所属官能团的表示,通过聚合函数将分子映射到特征空间,得到具有结构感知的特征表示;根据分子之间的指纹相似度,选取正、负样本,在特征空间中进行对比学习;在大样本分子数据集上利用对比学习的方法进行训练,得到具有结构感知的分子编码器,应用于下游分子属性的预测任务。本发明有助于捕捉更丰富的分子结构信息,解决分子属性预测的问题。

    一种基于化学元素知识图谱的分子图对比学习方法

    公开(公告)号:CN113990408A

    公开(公告)日:2022-01-28

    申请号:CN202111181509.7

    申请日:2021-10-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于化学元素知识图谱的分子图对比学习方法,包括:根据化学元素周期表中每个化学元素的所有化学属性,构建化学元素知识图谱;利用化学元素知识图谱对分子图进行图增强得到分子增强图;利用可插拔表示模型获得分子图和分子增强图的图表示;采用硬负样本挖掘技术选出与分子图在分子指纹空间相似的其他分子图作为负样本;将正样本对和负样本对的图表示映射到同一空间后,通过最大化正样本对之间的一致性同时最小化负样本对之间的一致性构建对比损失函数,利用对比损失函数进行优化学习;将参数确定的可插拔表示模型与非线性分类器形成预测模型,利用参数微调的预测模型进行分子图的分子性质的预测,以提升分子性质的预测准确性。

    一种基于知识图谱蒸馏的知识图谱嵌入压缩方法

    公开(公告)号:CN113987196A

    公开(公告)日:2022-01-28

    申请号:CN202111152202.4

    申请日:2021-09-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于知识图谱蒸馏的知识图谱嵌入压缩方法,将充分捕捉高维知识图谱嵌入模型(Teacher模型)中的三元组信息和嵌入结构信息蒸馏到知识图谱嵌入模型(Student模型)中,在保证Student模型存储和推理效率的情况下,提升了Student模型的表达能力,在蒸馏过程中考虑了Teacher模型和Student模型之间的双重影响,提出了软标签评估机制来区分不同三元组的软标签的质量,并提出了先固定Teacher模型后解除固定Teacher模型的训练方式,来提高Student模型对Teacher模型的适应性,最终提升Student模型的性能。

    一种基于联邦学习的知识图谱表示方法

    公开(公告)号:CN113886598A

    公开(公告)日:2022-01-04

    申请号:CN202111134706.3

    申请日:2021-09-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于联邦学习的知识图谱表示学习方法,包括:首先建立了中央服务器和多个客户端;中央服务器聚合来自不同客户端的实体嵌入,并将聚合后的嵌入发送回每个客户端;客户端使用本地的三元组更新实体和关系嵌入,并将更新后的实体嵌入矩阵发送给中央服务器。此外,考虑到联邦知识图嵌入框架所学习的嵌入是对仅基于一个知识图而没有联邦设置的训练嵌入的补充,因此设置了知识图谱融合步骤以融合使用和不使用联邦设置学习的嵌入。该方法能够同时利用多个知识图谱相互补充并且保证了数据的隐私性,在知识图谱补全任务中具有很好的实用价值。

    一种能够编码关系语义多样性结构的知识图谱分布式表示方法

    公开(公告)号:CN109063021B

    公开(公告)日:2021-10-15

    申请号:CN201810764406.5

    申请日:2018-07-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种能够编码关系语义多样性结构的知识图谱分布式表示方法,从知识图谱中图结构多样性的角度出发,挖掘和总结含有丰富语义信息的子图结构,并将子图结构与关系相关的语义信息联系起来,例如自反性、对称性、传递性等;本发明方法能够更好地编码图结构的多样性,因而可以更好地捕捉知识图谱中存在的语义信息,并达到更好的补全和预测效果,在链接预测任务中能取得更好的表现,具有较强的扩展性,对于在知识图谱分布式表示中编码关系语义多样性结构的应用具有很好的实用价值。

    一种基于对比学习的分子图表示学习方法

    公开(公告)号:CN112669916A

    公开(公告)日:2021-04-16

    申请号:CN202011564310.8

    申请日:2020-12-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对比学习的分子图表示学习方法,包括:获取每个分子的分子指纹表示,计算每两个分子指纹之间的相似度;收集全量的化学官能团信息,为分子中的每个原子匹配对应的官能团;用异构图对分子图建模;利用结构感知分子编码器中的RGCN编码分子中每个原子的表示及其所属官能团的表示,通过聚合函数将分子映射到特征空间,得到具有结构感知的特征表示;根据分子之间的指纹相似度,选取正、负样本,在特征空间中进行对比学习;在大样本分子数据集上利用对比学习的方法进行训练,得到具有结构感知的分子编码器,应用于下游分子属性的预测任务。本发明有助于捕捉更丰富的分子结构信息,解决分子属性预测的问题。

    一种基于知识图谱规则嵌入的组合商品挖掘方法

    公开(公告)号:CN112633927A

    公开(公告)日:2021-04-09

    申请号:CN202011538259.3

    申请日:2020-12-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于知识图谱规则嵌入的组合商品挖掘方法,包括:将规则、商品、属性和属性值表示成embedding;将规则和属性的embedding拼接输入到第一个神经网络中得到属性的重要性分数;将规则和属性拼接输入到第二个神经网络中得到这条规则在该属性下应该取的属性值的embedding;计算输入的两个商品在该属性下的取值与模型计算出来的属性值的embedding的相似性程度;计算所有的属性‑属性值对的得分汇总后可以得到这两个商品在该规则下的得分;然后与这两个商品真实的分数做交叉熵损失,用基于梯度下降的优化算法迭代训练;模型训练好后可以通过类似的方式解析规则的embedding,从而得到人可以理解的规则。

Patent Agency Ranking