-
公开(公告)号:CN116261852A
公开(公告)日:2023-06-13
申请号:CN202180066223.6
申请日:2021-07-16
Applicant: 国际商业机器公司
IPC: H04N5/265
Abstract: 一种用于使用张量神经网络实现视频帧合成的方法,包括接收包括一个或多个缺失帧的输入视频数据;将输入视频数据转换为输入张量;通过基于输入张量的张量完成,通过基于变换的张量神经网络(TTNet)来生成输出视频数据,输出视频数据包括对应于一个或多个缺失帧的一个或多个合成帧,TTNet包括实现张量迭代收缩阈值化算法(ISTA)的多个阶段;以及基于输出视频数据来获取损失函数。
-
公开(公告)号:CN114127847A
公开(公告)日:2022-03-01
申请号:CN202080051824.5
申请日:2020-07-14
Applicant: 国际商业机器公司
IPC: G10L25/30 , G10L25/57 , H04N21/234 , H04N21/25 , H04N21/266 , H04N21/81 , H04N21/845 , H04N21/854 , G06N3/04 , G06N3/08
Abstract: 计算设备接收视频馈送。视频馈送被划分成视频片段序列。针对每个视频片段,提取该视频片段的视觉特征。基于所提取的视觉特征产生预测频谱图。从预测频谱图产生合成音频波形。视频馈送的所有合成音频波形被连接以生成与视频馈送同步的合成音轨。
-
公开(公告)号:CN111667049B
公开(公告)日:2024-03-05
申请号:CN202010153487.2
申请日:2020-03-06
Applicant: 国际商业机器公司
IPC: G06N3/0464 , G06N3/094 , G06N20/00 , G06F21/55
Abstract: 本公开的实施例涉及量化深度学习计算系统对对抗性扰动的脆弱性。提供了用于生成对抗性扰动攻击敏感度(APAS)可视化的机制。机制接收自然输入数据集和对应对抗性攻击输入数据集,其中对抗性攻击输入数据集包括旨在引起计算机模型错误分类的扰动。机制基于计算机模型对自然输入数据集和对应对抗性攻击输入数据集的处理,确定计算机模型对对抗性攻击输入数据集中扰动的敏感度测量。基于自然输入数据集和对抗性攻击输入数据集处理结果,机制为计算机模型生成分类激活图(CAM),并基于敏感度测量生成敏感度覆盖。敏感度覆盖图形地表示扰动敏感度的不同分类。机制将敏感度覆盖应用于CAM,以生成并输出对抗性攻击的扰动的计算机模型敏感度的图形可视化输出。
-
公开(公告)号:CN117355893A
公开(公告)日:2024-01-05
申请号:CN202280036866.0
申请日:2022-05-24
Applicant: 国际商业机器公司
IPC: G10L21/007
Abstract: 提供了一种使用机器学习模型用于口头的自然语言中的韵律的分离的计算机实现的方法。该方法包括由计算设备对口头的自然语言编码以产生内容代码。该方法还包括由计算设备在无文本转录的情况下通过对机器学习模型应用无监督技术来重采样内容代码以模糊韵律,以生成韵律模糊的内容代码。该方法附加地包括由计算设备解码韵律模糊的内容代码以基于内容代码间接地合成语音。
-
公开(公告)号:CN115700589A
公开(公告)日:2023-02-07
申请号:CN202210848610.1
申请日:2022-07-19
Applicant: 国际商业机器公司
IPC: G06F40/35 , G06F16/783 , G06F16/332 , G06N3/092 , G06N20/00
Abstract: 本公开涉及用于视频问题回答的神经符号动作变换器。提供了用于执行基于人工智能的视频问题回答的机制。视频解析器对输入视频数据序列进行解析以生成情形数据结构,每个情形数据结构包括对应于实体的数据元素和实体之间的第一关系,所述实体和所述第一关系由所述视频解析器识别为存在于所述输入视频数据序列的图像中。第一机器学习计算机模型对情形数据结构进行操作,以预测情形数据结构之间的第二关系。第二机器学习计算机模型对所接收的输入问题执行以预测要执行以回答所接收的问题的可执行程序。该程序在情形数据结构和预测的第二关系上执行。基于执行程序的结果来输出问题的回答。
-
-
公开(公告)号:CN111667049A
公开(公告)日:2020-09-15
申请号:CN202010153487.2
申请日:2020-03-06
Applicant: 国际商业机器公司
Abstract: 本公开的实施例涉及量化深度学习计算系统对对抗性扰动的脆弱性。提供了用于生成对抗性扰动攻击敏感度(APAS)可视化的机制。机制接收自然输入数据集和对应对抗性攻击输入数据集,其中对抗性攻击输入数据集包括旨在引起计算机模型错误分类的扰动。机制基于计算机模型对自然输入数据集和对应对抗性攻击输入数据集的处理,确定计算机模型对对抗性攻击输入数据集中扰动的敏感度测量。基于自然输入数据集和对抗性攻击输入数据集处理结果,机制为计算机模型生成分类激活图(CAM),并基于敏感度测量生成敏感度覆盖。敏感度覆盖图形地表示扰动敏感度的不同分类。机制将敏感度覆盖应用于CAM,以生成并输出对抗性攻击的扰动的计算机模型敏感度的图形可视化输出。
-
公开(公告)号:CN114127847B
公开(公告)日:2024-10-29
申请号:CN202080051824.5
申请日:2020-07-14
Applicant: 国际商业机器公司
IPC: G10L25/30 , G10L25/57 , H04N21/234 , H04N21/25 , H04N21/266 , H04N21/81 , H04N21/845 , H04N21/854 , G06N3/0455 , G06N3/08
Abstract: 计算设备接收视频馈送。视频馈送被划分成视频片段序列。针对每个视频片段,提取该视频片段的视觉特征。基于所提取的视觉特征产生预测频谱图。从预测频谱图产生合成音频波形。视频馈送的所有合成音频波形被连接以生成与视频馈送同步的合成音轨。
-
公开(公告)号:CN116074575A
公开(公告)日:2023-05-05
申请号:CN202211312200.1
申请日:2022-10-25
Applicant: 国际商业机器公司
IPC: H04N21/44 , H04N21/4402
Abstract: 处理器可以接收按顺序包括多个视频帧的视频和关于视频的问题。对于多个视频帧中的视频帧,处理器可将视频帧解析为对象及对象之间的关系,且创建表示对象的节点和表示关系的边的子图,其中对于多个视频帧中的每一视频帧执行解析及创建,其中可创建多个子图。处理器可通过学习子图的节点之间的关系来创建连接子图的超图,其中创建超边以表示多个子图中子图的至少节点与另一子图的至少节点之间的关系。处理器可基于超图来生成对问题的回答。
-
公开(公告)号:CN114981800A
公开(公告)日:2022-08-30
申请号:CN202180008767.7
申请日:2021-02-11
Applicant: 国际商业机器公司
IPC: G06F16/36
Abstract: 根据本发明的实施例,提供一种用于为自动化机器学习系统的用户个性化机器学习模型的方法,机器学习模型由自动化机器学习系统生成。该方法包括获得用于训练第一神经网络、第二神经网络和第三神经网络的第一组数据集,将训练数据集输入到神经网络,调整用于测试和训练神经网络的第一、神经网络第二神经网络和第三神经网络的超参数,输入第二组数据集到经训练的神经网络和第三神经网络生成包括每个机器学习模型的每个用户的相关性分数的第三输出数据,并显示与每个用户相关联的机器学习模型的列表,每个机器学习模型显示相关性分数。
-
-
-
-
-
-
-
-
-