-
公开(公告)号:CN118735005A
公开(公告)日:2024-10-01
申请号:CN202410778100.0
申请日:2024-06-17
Applicant: 中国科学院计算技术研究所
IPC: G06N20/20 , G06N3/084 , G06N3/09 , G06V10/26 , G06V10/764 , G06V10/80 , G06V10/82 , G06F18/241 , G06F18/25
Abstract: 本发明提出一种基于模态调和的多模态模型训练方法和装置,包括:获取已标注类别标签的多模态数据,并将其转化为符合模型结构输入的指定形式,得到训练数据。构建包括多个学习器的多模态模型,每个学习器对应一种模态,用于提取对应模态数据的特征,根据各学习器提取的特征进行分类,通过分类结果和该类别标签构建损失函数,依次交替训练每一个模态的学习器,以完成对该多模态模型的训练;将待分类多模态数据输入训练完成后的多模态模型,得到每个学习器的输出特征,融合所有该输出特征,得到该待分类多模态数据的分类结果。
-
公开(公告)号:CN117746302A
公开(公告)日:2024-03-22
申请号:CN202410166668.7
申请日:2024-02-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明提供了用于视频相似度学习模型的训练方法,包括:获取训练集,包括多个原始样本和指示对应样本类别的标签,原始样本为一段视频且包括多个视频帧;利用训练集多次迭代训练模型,得到经训练的模型,每次包括:针对每个类别,将该类别的一个原始样本作为查询样本,其他原始样本与查询样本构成样本对,得到多个样本对;利用模型提取样本对中样本的特征向量,包括样本的每个视频帧的块级特征序列;基于样本对构建多对视频帧,根据样本的多个视频帧的块级特征序列确定多对视频帧的帧级相似度,根据该帧级相似度确定样本对中两个样本间的视频级相似度;利用预设的损失函数根据查询样本对应的多个样本对的视频级相似度计算的总损失更新模型参数。
-
公开(公告)号:CN117453869A
公开(公告)日:2024-01-26
申请号:CN202311286681.8
申请日:2023-10-07
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/36 , G06F40/30 , G06N5/022 , G06N5/02 , G06N5/04 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明提出了一种知识图谱问答模型构建方法,所述知识图谱问答模型用于根据知识图谱推出问题的答案,所述方法包括:S1、构建初始知识图谱问答模型;其中,所述初始知识图谱问答模型包括:问题分解模块、嵌入模块和问答模块;S2、获取第一训练集,所述第一训练集包括多个第一训练样本和第一标签,所述多个第一训练样本为问题,所述标签为所述第一训练样本的答案真值;S3、利用所述第一训练集对所述初始知识问答模型进行训练,并在训练中利用预设的损失函数更新所述知识图谱问答模型的参数。
-
公开(公告)号:CN117151225A
公开(公告)日:2023-12-01
申请号:CN202311042747.9
申请日:2023-08-18
Applicant: 中国科学院计算技术研究所
IPC: G06N5/04 , G06N3/0455 , G06N3/042 , G06N3/0495 , G06N3/082 , G06V10/70 , G06V10/82 , G06F16/332 , G06F16/36 , G06N5/022 , G06F40/30
Abstract: 本发明提供了一种基于路径推理的开放视觉问答的系统,包括:模式图构建模块,用于根据输入的图像和针对该图像提出的问题文本,构建第二模式图;剪枝网络,包括节点编码器和剪枝层,节点编码器,用于根据图像、问题文本以及各个节点的类型提取节点的嵌入向量;剪枝层,用于对第二模式图进行剪枝,得到第三模式图;路径推理网络,包括路径编码器、双线性层和输出层,路径编码器确定候选推理路径的嵌入向量,双线性层,用于确定各候选推理路径的嵌入向量与多模态上下文特征的匹配概率,输出层,用于根据各候选推理路径对应的匹配概率确定推理结果。
-
公开(公告)号:CN117151213A
公开(公告)日:2023-12-01
申请号:CN202311074989.6
申请日:2023-08-24
Applicant: 中国科学院计算技术研究所
IPC: G06N5/02 , G06F16/36 , G06Q30/0601
Abstract: 本发明提供一种知识库学习方法,所述方法包括:S1、获取已有的知识库并进行初始化以获取学习数据及其对应的初始嵌入表示,其中,所述学习数据包括多个多元组,每一个多元组均包括一个多元关系及与该多元关系对应的一个或多个角色‑实体对,且每一角色‑实体对被分配一个子关系;S2、以预设的损失函数为学习目标,按照预设的迭代方式对所述学习数据进行多轮迭代学习以得到其对应的目标嵌入表示。本发明通过学习多元组中角色和实体之间的语义信息以捕获角色和实体的兼容关系,进而探究角色和实体之间的潜在交互,并且为多元组中的每个角色‑实体对分配子关系并学习实体和子关系之间的语义信息,实现以更精细的方式挖掘知识库的潜在语义信息。
-
公开(公告)号:CN117057336A
公开(公告)日:2023-11-14
申请号:CN202311091193.1
申请日:2023-08-28
Applicant: 中国科学院计算技术研究所
IPC: G06F40/189 , G06F16/36 , G06F18/214
Abstract: 本发明实施例提供了一种知识图谱实体对齐系统构建方法,该方法:S1、构建初始知识图谱实体对齐系统,其中,所述初始知识图谱实体对齐系统包括:源编码单元、目标编码单元、融合映射单元、相似度度量单元以及对齐单元;S2、获取源知识图谱和目标知识图谱以及对应的实体对应数据池;S3、利用源知识图谱和目标知识图谱以及对应的实体对应数据池,对所述初始知识图谱实体对齐系统进行多次迭代训练,并在每次迭代训练中按照预设的多组损失函数分别更新所述源编码单元、所述目标编码单元以及所述融合映射单元的参数。通过上述方法构建的初始知识图谱实体对齐系统经训练能够得到的一个可以有效解决不同知识图谱之间的异构性问题的知识图谱实体对齐系统。
-
公开(公告)号:CN112861006A
公开(公告)日:2021-05-28
申请号:CN202110198542.4
申请日:2021-02-22
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06K9/62
Abstract: 本发明提出一种融合元路径语义的推荐方法,包括:基于异构信息网络及用户/商品评分数据集,计算所述用户/商品的相对重要性二部图;利用所述相对重要性二部图指导用户/商品结点之间的信息传播,得到所述用户/商品结点的嵌入表达;将所述用户/商品结点的嵌入表达进行变换得到用于推荐的所述用户/商品结点的最终嵌入表达,并将所述用户/商品结点的最终嵌入表达输入一推荐模型得到所述用户/商品的预测分数。
-
公开(公告)号:CN112270571A
公开(公告)日:2021-01-26
申请号:CN202011209043.2
申请日:2020-11-03
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于冷启动广告点击率预估模型的元模型训练方法,包括:S1、构建初始元模型并初始化元模型的参数;S2、获取未被点击过的未知广告组成的数据集,其中,每一个未知广告对应一个任务;S3、使用步骤S2中的数据集对元模型进行多轮训练直至收敛。本发明将每个已知任务的权重作为可学习的参数,并将加权后的任务分布和原始经验分布之间的卡方散度作为约束条件,形成了一种对于任务难度自适应的元学习损失函数。一方面,通过在训练过程中动态平衡各个任务的权重,从原本被忽略的难任务中挖掘到更多的有效知识,从而提升了模型的整体性能。另一方面,通过将任务权重和模型其他参数的学习问题建模为最大‑最小优化问题,利用GDmax算法对其进行了有效的求解,可以快速的达到收敛。
-
公开(公告)号:CN112184391A
公开(公告)日:2021-01-05
申请号:CN202011109159.9
申请日:2020-10-16
Applicant: 中国科学院计算技术研究所
IPC: G06Q30/06 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供了一种推荐模型的训练方法、介质、电子设备和推荐模型,训练方法包括A1、构建推荐模型、损失构建模块和多目标优化模块;A2、获取不同用户的商品交互记录,根据用户属性设置不同的用户组;A3、利用商品交互记录对推荐模型进行多次迭代训练至收敛,其中,每次训练包括:A31、用推荐模型从本次获取的商品交互记录中学习用户对商品的决策过程,获取用户对所有商品的偏好概率;A32、基于用户对所有商品的偏好概率,损失构建模块构建第一损失函数用于计算针对不同用户的推荐准确性损失以及构建连续可微的第二损失函数用于计算针对不同的用户组的推荐公平性损失;A33、多目标优化模块根据推荐准确性损失和推荐公平性损失确定参数更新方向。
-
公开(公告)号:CN109284414B
公开(公告)日:2020-12-04
申请号:CN201811156579.5
申请日:2018-09-30
Applicant: 中国科学院计算技术研究所
IPC: G06F16/532 , G06F16/33 , G06F16/901 , G06F40/30
Abstract: 本发明涉及一种基于语义保持的跨模态内容检索方法,包括:以第一模态样本和第二模态样本的特征向量为结点分别构建第一特征图和第二特征图;提取所有样本的标签向量为结点构建语义图;获取每个结点的邻居结点;分别构建用于将第一模态样本和第二模态样本映射为隐含表示的第一映射函数和第二映射函数;对映射函数进行学习,近似最大化每个结点的邻居结点出现的似然,并使得每个隐含表示可以重建对应结点对应的标签信息;以第一映射函数将检索样本映射为检索隐含表示,并以第二映射函数将每个第二模态样本映射为目标隐含表示;获取检索隐含表示与每个目标隐含表示的距离,以所有小于检索阈值的距离对应的第二模态样本为检索结果。
-
-
-
-
-
-
-
-
-