-
公开(公告)号:CN112084784A
公开(公告)日:2020-12-15
申请号:CN202010528591.5
申请日:2020-06-11
Applicant: 国际商业机器公司
IPC: G06F40/30 , G06F40/117 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种预测语义角色标注的功能性标记。根据一个实施例的计算机实现的方法包括在调度器处接收训练数据实例和目标实例,由调度器从训练数据实例和目标实例生成输入序列,从调度器向编码器发送输入序列,由编码器将输入序列映射到特征向量,将特征向量从编码器发送到调度器,将特征向量从调度器发送到预测器,以及由预测器将特征向量映射到类向量以创建目标实例的标签。
-
公开(公告)号:CN117043785A
公开(公告)日:2023-11-10
申请号:CN202280021652.6
申请日:2022-03-14
Applicant: 国际商业机器公司
Abstract: 提供了一种用于逻辑神经网络(LNN)中的实体链接的系统、计算机程序产品和方法。针对经注释的数据集中的一个或多个实体‑提及对生成特征集合。针对链接LNN规则模板的实体来评估所生成的特征集合,该LNN规则模板具有被组织在树结构中的一个或多个逻辑连接规则和对应的连接性权重。人工神经网络与对应的机器学习算法一起被用来学习连接性权重。与逻辑连接规则相关联的连接性权重被选择性地更新,并且利用经学习的阈值和针对逻辑连接规则的经学习的权重来生成经学习的模型。
-
公开(公告)号:CN112084784B
公开(公告)日:2024-11-01
申请号:CN202010528591.5
申请日:2020-06-11
Applicant: 国际商业机器公司
IPC: G06F40/30 , G06F40/117 , G06N3/0455 , G06N3/092
Abstract: 本发明涉及一种预测语义角色标注的功能性标记。根据一个实施例的计算机实现的方法包括在调度器处接收训练数据实例和目标实例,由调度器从训练数据实例和目标实例生成输入序列,从调度器向编码器发送输入序列,由编码器将输入序列映射到特征向量,将特征向量从编码器发送到调度器,将特征向量从调度器发送到预测器,以及由预测器将特征向量映射到类向量以创建目标实例的标签。
-
公开(公告)号:CN104714800B
公开(公告)日:2018-06-29
申请号:CN201410679793.4
申请日:2014-11-24
Applicant: 国际商业机器公司
IPC: G06F8/20
CPC classification number: G06F17/30401 , G06F17/30427 , G06F17/30554 , G06F17/30654
Abstract: 本发明涉及用于根据任务说明来构建概念的方法和系统。方法包括经由用户界面接收来自用户的自然语言形式的任务说明。该方法还包括将任务说明解析成多个构件,并且在数据库中搜索具有与该多个构件中的至少一部分近似的模式的现有概念。该概念包含可由文本模式表示的语义。该方法还包括识别该多个构件中没有包含于现有概念内的任意构件,并且创建结合了现有概念与该多个构件中没有包含于现有概念内的构件的新概念。
-
公开(公告)号:CN111199726B
公开(公告)日:2023-09-22
申请号:CN201911003118.9
申请日:2019-10-22
Applicant: 国际商业机器公司
Abstract: 本公开涉及基于语音成分的细粒度映射的语言语音处理。在一个实施例中,一种计算机实现的方法包括获取特定语言的第一单词的发音以及识别该发音的语音成分。该方法包括获取针对在第一单词的发音中所识别的语音成分的类型的语音成分映射表,以及使用语音成分映射表将语音值分配给所识别的语音成分。对于第二单词,该方法包括获取第二单词的发音,识别该发音的语音成分,以及将语音值分配给所识别的语音成分。另外,该方法包括使用第一单词和第二单词的相应的识别的语音成分的分配语音值来计算第一单词的所识别的语音成分与第二单词的所识别的语音成分之间的语音距离,以及将计算出的语音距离存储在文件中。
-
公开(公告)号:CN116235178A
公开(公告)日:2023-06-06
申请号:CN202180063283.2
申请日:2021-09-14
Applicant: 国际商业机器公司
IPC: G06F40/55
Abstract: 通过以下方法为目标语言提供预测模型:根据一组未标记的目标语言文本单元确定标记的源语言文本单元的实例权重(142);由一个或多个计算机处理器(254)根据实例权重(142)缩放源语言文本单元的预测标签和源语言文本单元的基本事实标签之间的误差;由一个或多个计算机处理器(254)根据该误差更新目标语言的预测神经网络模型的网络参数;以及由一个或多个计算机处理器(254)向用户提供目标语言的预测神经网络模型。
-
公开(公告)号:CN116194908A
公开(公告)日:2023-05-30
申请号:CN202180056360.1
申请日:2021-08-09
Applicant: 国际商业机器公司
Inventor: 王大阔 , 淦创 , G·布拉姆贝勒 , L·阿米尼 , H·C·萨姆洛维茨 , K·凯特 , 陈蓓 , M·维图巴 , A·艾弗菲米艾弗斯基 , I·卡西斯 , 李蕴瑶 , A·C·I·马洛西 , A·巴特扎吉 , B·卡瓦斯 , S·古拉伽达 , L·普帕 , T·佩达帕蒂 , A·格雷
IPC: G06F16/2455
Abstract: 计算机使用元学习机器学习模型来自动选择机器学习模型流水线。计算机接收基础事实数据和流水线偏好元数据。计算机确定适合于基础事实数据的一组流水线,并且每个流水线包括算法。流水线可包括数据预处理例程。计算机为流水线生成超参数集合。计算机将预处理例程应用于基础事实数据,以生成基础事实数据的一组预处理的集合,并对每个流水线的超参数集合性能进行排序,以针对每个流水线建立优选的超参数集合。计算机选择偏好的数据特征并将每个流水线以及相关联的优选的超参数集合用于对预处理的基础事实数据的偏好的数据特征进行评分。计算机对流水线性能进行排序,并根据排序选择候选流水线。
-
公开(公告)号:CN113906452A
公开(公告)日:2022-01-07
申请号:CN202080038347.9
申请日:2020-06-04
Applicant: 国际商业机器公司
IPC: G06N20/00
Abstract: 本文提供了用于利用转移学习的低资源实体解析的方法、系统和计算机程序产品。一种计算机实现的方法,包括:通过第一实体解析模型来处理输入数据,其中输入数据包括已标记输入数据和未标记输入数据;标识未标记输入数据的要被用于训练神经网络实体解析模型的一个或多个部分,其中所述标识包括将一个或多个主动学习算法应用于第一实体解析模型;使用(i)所述未标记输入数据的一个或多个部分和(ii)一个或多个深度学习技术来训练神经网络实体解析模型;以及通过将经训练的神经网络实体解析模型应用于一个或多个数据集来执行一个或多个实体解析任务。
-
-
公开(公告)号:CN111199726A
公开(公告)日:2020-05-26
申请号:CN201911003118.9
申请日:2019-10-22
Applicant: 国际商业机器公司
Abstract: 本公开涉及基于语音成分的细粒度映射的语言语音处理。在一个实施例中,一种计算机实现的方法包括获取特定语言的第一单词的发音以及识别该发音的语音成分。该方法包括获取针对在第一单词的发音中所识别的语音成分的类型的语音成分映射表,以及使用语音成分映射表将语音值分配给所识别的语音成分。对于第二单词,该方法包括获取第二单词的发音,识别该发音的语音成分,以及将语音值分配给所识别的语音成分。另外,该方法包括使用第一单词和第二单词的相应的识别的语音成分的分配语音值来计算第一单词的所识别的语音成分与第二单词的所识别的语音成分之间的语音距离,以及将计算出的语音距离存储在文件中。
-
-
-
-
-
-
-
-
-