Patent search ap:("国际商业机器公司") AND inv:"淦创" Page 1

1.

发明公开
使用张量神经网络的视频帧合成审中-实审

公开(公告)号：CN116261852A

公开(公告)日：2023-06-13

申请号：CN202180066223.6

申请日：2021-07-16

Applicant: 国际商业机器公司

Inventor： 吴波 , 淦创 , 马腾飞 , 王大阔

IPC: H04N5/265

Abstract: 一种用于使用张量神经网络实现视频帧合成的方法，包括接收包括一个或多个缺失帧的输入视频数据；将输入视频数据转换为输入张量；通过基于输入张量的张量完成，通过基于变换的张量神经网络(TTNet)来生成输出视频数据，输出视频数据包括对应于一个或多个缺失帧的一个或多个合成帧，TTNet包括实现张量迭代收缩阈值化算法(ISTA)的多个阶段；以及基于输出视频数据来获取损失函数。

2.

发明公开
来自视频的同步声音生成有权

公开(公告)号：CN114127847A

公开(公告)日：2022-03-01

申请号：CN202080051824.5

申请日：2020-07-14

Applicant: 国际商业机器公司

Inventor： 张阳 , 淦创 , 刘思佳 , 王大阔

IPC: G10L25/30 , G10L25/57 , H04N21/234 , H04N21/25 , H04N21/266 , H04N21/81 , H04N21/845 , H04N21/854 , G06N3/04 , G06N3/08

Abstract: 计算设备接收视频馈送。视频馈送被划分成视频片段序列。针对每个视频片段，提取该视频片段的视觉特征。基于所提取的视觉特征产生预测频谱图。从预测频谱图产生合成音频波形。视频馈送的所有合成音频波形被连接以生成与视频馈送同步的合成音轨。

3.

发明授权
量化深度学习计算系统对对抗性扰动的脆弱性有权

公开(公告)号：CN111667049B

公开(公告)日：2024-03-05

申请号：CN202010153487.2

申请日：2020-03-06

Applicant: 国际商业机器公司

Inventor： 刘思佳 , 范权福 , 淦创 , 王大阔

IPC: G06N3/0464 , G06N3/094 , G06N20/00 , G06F21/55

Abstract: 本公开的实施例涉及量化深度学习计算系统对对抗性扰动的脆弱性。提供了用于生成对抗性扰动攻击敏感度(APAS)可视化的机制。机制接收自然输入数据集和对应对抗性攻击输入数据集，其中对抗性攻击输入数据集包括旨在引起计算机模型错误分类的扰动。机制基于计算机模型对自然输入数据集和对应对抗性攻击输入数据集的处理，确定计算机模型对对抗性攻击输入数据集中扰动的敏感度测量。基于自然输入数据集和对抗性攻击输入数据集处理结果，机制为计算机模型生成分类激活图(CAM)，并基于敏感度测量生成敏感度覆盖。敏感度覆盖图形地表示扰动敏感度的不同分类。机制将敏感度覆盖应用于CAM，以生成并输出对抗性攻击的扰动的计算机模型敏感度的图形可视化输出。

4.

发明公开
无文本转录的全局韵律类型转移审中-实审

公开(公告)号：CN117355893A

公开(公告)日：2024-01-05

申请号：CN202280036866.0

申请日：2022-05-24

Applicant: 国际商业机器公司

Inventor： 钱恺之 , 张阳 , 常十雨 , 熊瑾珺 , 淦创 , D·考克斯

IPC: G10L21/007

Abstract: 提供了一种使用机器学习模型用于口头的自然语言中的韵律的分离的计算机实现的方法。该方法包括由计算设备对口头的自然语言编码以产生内容代码。该方法还包括由计算设备在无文本转录的情况下通过对机器学习模型应用无监督技术来重采样内容代码以模糊韵律，以生成韵律模糊的内容代码。该方法附加地包括由计算设备解码韵律模糊的内容代码以基于内容代码间接地合成语音。

5.

发明公开
用于视频问题回答的神经符号动作变换器审中-实审

公开(公告)号：CN115700589A

公开(公告)日：2023-02-07

申请号：CN202210848610.1

申请日：2022-07-19

Applicant: 国际商业机器公司

Inventor： 吴波 , 淦创 , 王大阔 , 陈振方

IPC: G06F40/35 , G06F16/783 , G06F16/332 , G06N3/092 , G06N20/00

Abstract: 本公开涉及用于视频问题回答的神经符号动作变换器。提供了用于执行基于人工智能的视频问题回答的机制。视频解析器对输入视频数据序列进行解析以生成情形数据结构，每个情形数据结构包括对应于实体的数据元素和实体之间的第一关系，所述实体和所述第一关系由所述视频解析器识别为存在于所述输入视频数据序列的图像中。第一机器学习计算机模型对情形数据结构进行操作，以预测情形数据结构之间的第二关系。第二机器学习计算机模型对所接收的输入问题执行以预测要执行以回答所接收的问题的可执行程序。该程序在情形数据结构和预测的第二关系上执行。基于执行程序的结果来输出问题的回答。

6.

发明公开
用于视频接地的图形卷积网络审中-实审

公开(公告)号：CN114930317A

公开(公告)日：2022-08-19

申请号：CN202180008971.9

申请日：2021-02-11

Applicant: 国际商业机器公司

Inventor： 淦创 , 刘思佳 , S.达斯 , 王大阔 , 张阳

IPC: G06F16/73

Abstract: 一种方法和装置，包括：接收描述视频中的一方面的查询，所述视频包括多个帧；识别潜在地对应于所述查询的多个建议，其中，所述建议中的每一个包括所述多个帧的子集；使用识别所述建议之间的关系的图形卷积网络来对所述建议进行排名；以及基于所述排名，选择所述建议中的一个建议作为与所述查询相关的视频片段。

7.

发明公开
量化深度学习计算系统对对抗性扰动的脆弱性有权

公开(公告)号：CN111667049A

公开(公告)日：2020-09-15

申请号：CN202010153487.2

申请日：2020-03-06

Applicant: 国际商业机器公司

Inventor： 刘思佳 , 范权福 , 淦创 , 王大阔

IPC: G06N3/04 , G06N3/08 , G06N20/00 , G06F21/55

Abstract: 本公开的实施例涉及量化深度学习计算系统对对抗性扰动的脆弱性。提供了用于生成对抗性扰动攻击敏感度(APAS)可视化的机制。机制接收自然输入数据集和对应对抗性攻击输入数据集，其中对抗性攻击输入数据集包括旨在引起计算机模型错误分类的扰动。机制基于计算机模型对自然输入数据集和对应对抗性攻击输入数据集的处理，确定计算机模型对对抗性攻击输入数据集中扰动的敏感度测量。基于自然输入数据集和对抗性攻击输入数据集处理结果，机制为计算机模型生成分类激活图(CAM)，并基于敏感度测量生成敏感度覆盖。敏感度覆盖图形地表示扰动敏感度的不同分类。机制将敏感度覆盖应用于CAM，以生成并输出对抗性攻击的扰动的计算机模型敏感度的图形可视化输出。

8.

发明授权
来自视频的同步声音生成有权

公开(公告)号：CN114127847B

公开(公告)日：2024-10-29

申请号：CN202080051824.5

申请日：2020-07-14

Applicant: 国际商业机器公司

Inventor： 张阳 , 淦创 , 刘思佳 , 王大阔

IPC: G10L25/30 , G10L25/57 , H04N21/234 , H04N21/25 , H04N21/266 , H04N21/81 , H04N21/845 , H04N21/854 , G06N3/0455 , G06N3/08

Abstract: 计算设备接收视频馈送。视频馈送被划分成视频片段序列。针对每个视频片段，提取该视频片段的视觉特征。基于所提取的视觉特征产生预测频谱图。从预测频谱图产生合成音频波形。视频馈送的所有合成音频波形被连接以生成与视频馈送同步的合成音轨。

9.

发明公开
用于真实世界视频问题回答的变换器审中-实审

公开(公告)号：CN116074575A

公开(公告)日：2023-05-05

申请号：CN202211312200.1

申请日：2022-10-25

Applicant: 国际商业机器公司

Inventor： 吴波 , 淦创 , 陈振方 , 王大阔

IPC: H04N21/44 , H04N21/4402

Abstract: 处理器可以接收按顺序包括多个视频帧的视频和关于视频的问题。对于多个视频帧中的视频帧，处理器可将视频帧解析为对象及对象之间的关系，且创建表示对象的节点和表示关系的边的子图，其中对于多个视频帧中的每一视频帧执行解析及创建，其中可创建多个子图。处理器可通过学习子图的节点之间的关系来创建连接子图的超图，其中创建超边以表示多个子图中子图的至少节点与另一子图的至少节点之间的关系。处理器可基于超图来生成对问题的回答。

10.

发明公开
个性化自动化机器学习审中-实审

公开(公告)号：CN114981800A

公开(公告)日：2022-08-30

申请号：CN202180008767.7

申请日：2021-02-11

Applicant: 国际商业机器公司

Inventor： 王大阔 , 淦创 , 谭铭 , A·乔杜里 , 鞠琳

IPC: G06F16/36

Abstract: 根据本发明的实施例，提供一种用于为自动化机器学习系统的用户个性化机器学习模型的方法，机器学习模型由自动化机器学习系统生成。该方法包括获得用于训练第一神经网络、第二神经网络和第三神经网络的第一组数据集，将训练数据集输入到神经网络，调整用于测试和训练神经网络的第一、神经网络第二神经网络和第三神经网络的超参数，输入第二组数据集到经训练的神经网络和第三神经网络生成包括每个机器学习模型的每个用户的相关性分数的第三输出数据，并显示与每个用户相关联的机器学习模型的列表，每个机器学习模型显示相关性分数。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification