一种基于参数传播的多任务图片理解方法与装置

    公开(公告)号:CN113505839A

    公开(公告)日:2021-10-15

    申请号:CN202110804217.8

    申请日:2021-07-16

    Applicant: 清华大学

    Abstract: 本发明公开一种基于参数传播的多任务图片理解方法与装置,所述方法包括:获取若干张图片数据,并进行预处理后构建为训练数据集;获取若干个图片理解任务,对每个图片理解任务均构建一个任务模型,其中,若干个图片理解任务之间具有关联,每个任务模型具有独立的参数;基于线性参数传播机制,通过训练数据集对各任务模型进行训练;训练好的各任务模型分别用于对待处理图片进行图片理解。本发明完全抛弃参数共享的这一机制,假设不同图片理解任务之间的参数是完全独立,并且在训练的过程中,通过不同图片理解任务之间的参数传播来实现任务关联,有效避免了传统基于参数共享的多个图片理解任务中的负面迁移问题,提高了每个图片理解任务的预测效果。

    一种任务预测方法及装置
    2.
    发明公开

    公开(公告)号:CN112418302A

    公开(公告)日:2021-02-26

    申请号:CN202011307325.6

    申请日:2020-11-20

    Abstract: 本申请公开一种任务预测方法及装置;本申请与人工智能的机器学习领域相关,可以获取预设任务的至少两个模态的样本数据、以及至少两个模态的样本数据的样本标签;通过多模态网络对样本数据进行特征提取,得到每个模态的样本数据对应的特征向量;通过多模态网络基于特征向量,确定预设任务的任务预测结果;获取预设任务的至少两个模态的相似度;基于相似度、任务预测结果以及样本标签,对多模态网络进行训练,以通过训练后的多模态网络进行任务预测;本申请可以提升多模态任务预测的准确率。

    基于时空注意力图神经网络的交通流量预测方法和装置

    公开(公告)号:CN117576894A

    公开(公告)日:2024-02-20

    申请号:CN202311402973.3

    申请日:2023-10-26

    Abstract: 本发明提供一种基于时空注意力图神经网络的交通流量预测方法和装置,时空注意力图神经网络包含时空特征学习层、池化层和预测层;利用路网空间拓扑结构图和时空特征学习层,对路网中各路口在预设时段内的细粒度流量数据进行时空双维度的信息融合学习,得到目标路径中各路口在预设时段内的细粒度流量特征;根据目标路径的路口连接情况和池化层,池化处理细粒度流量特征,得到目标路径在预设时段内的粗粒度流量特征;基于预测层、粗粒度流量特征和目标路径在预设时段内的粗粒度流量数据,预测目标路径在目标时段的流量。本发明利用细粒度路口流量以及可捕捉不同路口、不同时段的流量时空关联规律的时空注意力图神经网络,精准预测粗粒度路径流量。

    用于训练用于模仿演示者的行为的神经网络的方法和装置

    公开(公告)号:CN117441174A

    公开(公告)日:2024-01-23

    申请号:CN202180098842.3

    申请日:2021-05-31

    Abstract: 本公开内容提供了一种用于训练用于模仿演示者的行为的神经网络(NN)模型的方法。该方法包括:获得表示演示者的用于执行任务的行为的演示数据,演示数据包括状态数据、动作数据和选项数据,其中,状态数据对应于用于执行任务的条件,选项数据对应于任务的子任务,并且动作数据对应于演示者的针对任务执行的动作;基于当前学习的策略来对表示NN模型的用于执行任务的行为的学习者数据进行采样,学习者数据包括状态数据、动作数据和选项数据,其中,状态数据对应于用于执行任务的条件,选项数据对应于任务的子任务,并且动作数据对应于NN模型的针对任务执行的动作,策略由用于确定当前选项的高级策略部分和用于确定当前动作的低级策略部分组成;以及基于演示数据和学习者数据,通过使用生成对抗性模仿学习(GAIL)过程来更新策略。

    抗体生成方法、装置、电子设备及存储介质

    公开(公告)号:CN115376611A

    公开(公告)日:2022-11-22

    申请号:CN202210918638.8

    申请日:2022-08-01

    Applicant: 清华大学

    Abstract: 本发明提供一种抗体生成方法、装置、电子设备及存储介质,其中,所述方法包括S1:获取待处理抗原‑抗体复合物;S2:基于待处理抗原‑抗体复合物得到表示图;S3:基于邻居节点的邻居节点表示和邻居节点坐标对节点进行链内更新,得到链内更新节点表示和链内更新节点坐标;S4:基于链内更新节点表示和链内更新节点坐标对节点进行链间更新,得到链间更新节点表示和链间更新节点坐标和链间更新表示图;S6:链间更新表示图作为表示图执行预设轮数S3至S5得到第一更新表示图;S7:第一更新表示图作为表示图执行预设轮数S3至S6得到目标更新表示图,基于目标更新表示图得到补全互补决定区的抗体。通过本发明使生成的抗体满足抗原特异性要求。

    一种对时间序列进行建模并识别的方法

    公开(公告)号:CN106295703B

    公开(公告)日:2022-03-25

    申请号:CN201610671152.3

    申请日:2016-08-15

    Applicant: 清华大学

    Abstract: 本发明涉及一种对时间序列进行建模并识别的方法,属于机器学习领域。该方法包括将传感器采集的数据按采集时间先后顺序排列而成的动态数据构成L条时间序列,随机选择L条时间序列中的60%‑80%的N条时间序列作为训练集,剩下的时间序列作为测试集;对训练集中的每一条时间序列采用线性动态系统模型进行建模,并训练集每一条时间序列的特征表示;随机从训练集中抽取J条时间序列作为字典组成字典集,从得到的训练集每一条训练时间序列的特征表示,学习出字典集的每一条时间序列的最优特征表示,同时计算每一条训练时间序列在字典集下的编码系数;用训练集的编码系数训练支持向量机模型,实现对时间序列的识别。本方法大幅降低了数据表示的复杂度,同时显著提高识别精度。

    3D分子理化性质预测方法、装置、电子设备及存储介质

    公开(公告)号:CN115359849A

    公开(公告)日:2022-11-18

    申请号:CN202211027315.6

    申请日:2022-08-25

    Applicant: 清华大学

    Inventor: 黄文炳 矫瑞 刘洋

    Abstract: 本发明提供一种3D分子理化性质预测方法、装置、电子设备及存储介质,所述方法包括:获取3D分子数据集,其中,3D分子数据集中包括3D分子样本;按照扰动尺度对3D分子样本的分子坐标施加扰动得到3D分子样本的分子扰动坐标;基于分子扰动坐标得到第一损失函数和第二损失函数;基于第一损失函数和第二损失函数得到目标损失函数;基于目标损失函数训练等变图神经网络,得到目标等变图神经网络;构建目标预测模型,其中,目标预测模型包括目标等变图神经网络和理化性质预测模型,理化性质预测模型包括多层感知机;将3D分子输入至目标预测模型,得到目标预测模型输出的3D分子的理化性质。通过本发明能够准确、高效得预测3D分子的理化性质。

    属性预测模型的训练方法、属性预测方法、装置及设备

    公开(公告)号:CN114758729A

    公开(公告)日:2022-07-15

    申请号:CN202110031384.3

    申请日:2021-01-11

    Abstract: 本申请公开了一种属性预测模型的训练方法、属性预测方法、装置及设备,涉及化学分子属性预测领域。该方法包括:获取第一组样本数据,第一组样本数据包括第一化学物质和第一化学物质的结构标签,结构标签用于描述化学物质中的原子结构;基于第一组样本数据训练得到预训练模型,预训练模型用于根据输入的化学物质输出化学物质的结构标签;获取第二组样本数据,第二组样本数据包括第二化学物质和第二化学物质的属性标签,属性标签用于描述化学物质的性质;基于第二组样本数据和预训练模型训练得到属性预测模型,属性预测模型用于根据输入的化学物质输出化学物质的属性标签。该方法可以减少训练属性预测模型所需的有标签数据量。

    一种对时间序列进行建模并识别的方法

    公开(公告)号:CN106295703A

    公开(公告)日:2017-01-04

    申请号:CN201610671152.3

    申请日:2016-08-15

    Applicant: 清华大学

    CPC classification number: G06K9/6256 G06K9/46 G06K9/6269 G06K2009/4695

    Abstract: 本发明涉及一种对时间序列进行建模并识别的方法,属于机器学习领域。该方法包括将传感器采集的数据按采集时间先后顺序排列而成的动态数据构成L条时间序列,随机选择L条时间序列中的60%-80%的N条时间序列作为训练集,剩下的时间序列作为测试集;对训练集中的每一条时间序列采用线性动态系统模型进行建模,并训练集每一条时间序列的特征表示;随机从训练集中抽取J条时间序列作为字典组成字典集,从得到的训练集每一条训练时间序列的特征表示,学习出字典集的每一条时间序列的最优特征表示,同时计算每一条训练时间序列在字典集下的编码系数;用训练集的编码系数训练支持向量机模型,实现对时间序列的识别。本方法大幅降低了数据表示的复杂度,同时显著提高识别精度。

Patent Agency Ranking