-
公开(公告)号:CN110019719A
公开(公告)日:2019-07-16
申请号:CN201711354191.1
申请日:2017-12-15
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332
Abstract: 在本文所描述的主题的实施例中,提出了一种基于断言的问答方式。在获得问题以及相关文章之后,根据文章的内容来确定针对该问题的断言回答,其中断言回答具有预定结构并且表示完整的语义。然后,可以向用户输出针对该问题的断言回答。在根据本文所描述的主题的实施例中,使用问题和相关文章作为输入,并且输出半结构化的断言回答。根据本文所描述的主题的实施例的断言回答能够提供比传统的短回答更丰富的语义内容,并且提供比传统的长回答更简洁的表达,由此提升了用户体验同时保证了回答的准确性。
-
公开(公告)号:CN118355434A
公开(公告)日:2024-07-16
申请号:CN202280080208.1
申请日:2022-10-19
Applicant: 微软技术许可有限责任公司
IPC: G10L15/16
Abstract: 提供了用于访问因子化神经换能器的系统和方法,该因子化神经换能器包括用于预测空白令牌的第一层集和用于预测词汇令牌的第二层集。第一层集包括空白预测器、编码器和联合网络,并且第二层集包括词汇预测器,词汇预测器是与空白预测器分离的预测器。上下文编码器被添加到因子化神经换能器,其编码长格式转录历史以生成长格式上下文嵌入,使得该因子化神经换能器被进一步配置成至少部分地通过使用该长格式上下文嵌入来执行长格式自动语音识别以增强对词汇令牌的预测。
-
公开(公告)号:CN117795593A
公开(公告)日:2024-03-29
申请号:CN202280053345.6
申请日:2022-03-24
Applicant: 微软技术许可有限责任公司
Abstract: 提供了用于通过以下中的至少一者来生成伪标记训练数据集的系统和方法:(1)基于将自动语音识别模型应用于未标记语音数据集,从自动语音识别模型提取中间输出集合,将中间输出集合聚类成不同聚类,以及生成包括与不同聚类相关联并且与未标记语音数据相对应的聚类分配的第一伪标记集,或者(2)通过将自动语音识别模型应用于未标记语音数据集来为未标记语音数据生成经解码单词序列集,以及通过将自动语音识别模型应用于(i)经解码单词序列集和(ii)未标记语音数据集这两者,来生成与未标记语音数据相关联的第二伪标记集。
-
公开(公告)号:CN116250039A
公开(公告)日:2023-06-09
申请号:CN202180055194.3
申请日:2021-06-29
Applicant: 微软技术许可有限责任公司
IPC: G10L15/32
Abstract: 提供了用于构建可配置的多语言模型的实施例。一种计算系统,其获得多个因语言而异的自动语音识别模块和通用自动语音识别模块,该通用自动语音识别模块在包括与多个不同语言中的每个不同语言相对应的训练数据的多语言训练数据集上被训练。该计算系统然后编译该通用自动语音识别模块与该多个因语言而异的自动语音识别模块以生成可配置的多语言模型,该多语言模型被配置成响应于标识与音频内容相关联的一个或多个目标语言的用户输入选择性地并动态地利用该多个因语言而异的自动语音识别模块的子集与该通用自动语音识别模块来处理该音频内容。
-
公开(公告)号:CN110019719B
公开(公告)日:2023-04-25
申请号:CN201711354191.1
申请日:2017-12-15
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332
Abstract: 在本文所描述的主题的实施例中,提出了一种基于断言的问答方式。在获得问题以及相关文章之后,根据文章的内容来确定针对该问题的断言回答,其中断言回答具有预定结构并且表示完整的语义。然后,可以向用户输出针对该问题的断言回答。在根据本文所描述的主题的实施例中,使用问题和相关文章作为输入,并且输出半结构化的断言回答。根据本文所描述的主题的实施例的断言回答能够提供比传统的短回答更丰富的语义内容,并且提供比传统的长回答更简洁的表达,由此提升了用户体验同时保证了回答的准确性。
-
公开(公告)号:CN108475264B
公开(公告)日:2022-03-01
申请号:CN201680077456.5
申请日:2016-08-01
Applicant: 微软技术许可有限责任公司
Abstract: 本主题涉及基于神经网络的翻译方法,其中,该方法包括:使用第一机器学习模块将第一语言的源句子映射到由知识库预定义的语义空间,以提取该源句子的关键信息;以及使用第二机器学习模块基于所提取的关键信息生成第二语言的目标句子。
-
公开(公告)号:CN108475264A
公开(公告)日:2018-08-31
申请号:CN201680077456.5
申请日:2016-08-01
Applicant: 微软技术许可有限责任公司
IPC: G06F17/28
CPC classification number: G06F17/2785 , G06F17/2809
Abstract: 本主题涉及基于神经网络的翻译方法,其中,该方法包括:使用第一机器学习模块将第一语言的源句子映射到由知识库预定义的语义空间,以提取该源句子的关键信息;以及使用第二机器学习模块基于所提取的关键信息生成第二语言的目标句子。
-
-
-
-
-
-