-
公开(公告)号:CN119317904A
公开(公告)日:2025-01-14
申请号:CN202280096642.9
申请日:2022-06-22
Applicant: 微软技术许可有限责任公司
IPC: G06F11/3668 , G06N3/006 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/088 , G06N3/09 , G06N3/092
Abstract: 一种用于基于像素的自动化测试的计算系统,自动化测试用于测试可导航模拟环境,计算系统包括一个或多个处理器,一个或多个处理器被配置为在运行时推理阶段执行应用测试程序。应用测试程序包括被训练为检测被测应用中的错误的机器学习模型。模拟环境的屏幕图像由对象检测模块处理以确定屏幕图像中是否存在关键对象。如果屏幕图像中存在关键对象,则应用测试程序执行对象调查模块,以生成用以调查关键对象的调查输入。如果屏幕图像中不存在关键对象,则应用测试程序执行环境探索模块,以生成环境探索动作,环境探索动作将被提供给待测应用作为模拟用户输入。
-
公开(公告)号:CN115602145A
公开(公告)日:2023-01-13
申请号:CN202110721773.9
申请日:2021-06-28
Applicant: 微软技术许可有限责任公司(US)
IPC: G10L13/08
Abstract: 根据本公开的实现,提出了一种基于文本生成语音的方案。在该方案中,生成与文本对应的初始音素序列,初始音素序列包括多个音素的特征表示。通过在初始音素序列中插入附加音素的特征表示来生成第一音素序列,附加音素与自然口语的特性有关。通过利用与多个音素和附加音素中的音素对应的专家模型来确定音素的持续时间,基于第一音素序列来生成第二音素序列。基于第二音素序列,确定与文本对应的自然口语类型的语音。以此方式,该方案能够基于自然口语类型的附加音素和多个专家模型来生成具有多变韵律的更真实的自然口语类型的语音。
-
公开(公告)号:CN115547278A
公开(公告)日:2022-12-30
申请号:CN202110732470.7
申请日:2021-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于说唱生成的方案。在该方案中,获取与说唱的第一部分相对应的输入序列。在输入序列中,第一部分的同一语句中的各个词按逆序排列,并且第一部分的节拍的节拍标识与对应于节拍的词相邻。确定分别与输入序列相对应的文本表示序列和押韵表示序列。基于文本表示序列和押韵表示序列,根据说唱生成模型,生成说唱的第二部分。以此方式,可以生成既押韵又具有节奏的说唱。
-
公开(公告)号:CN107798386A
公开(公告)日:2018-03-13
申请号:CN201610837511.8
申请日:2016-09-01
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N5/022 , G06F17/289
Abstract: 本公开的实施例涉及基于未标注数据的多过程协同训练。在利用一个转换过程将一种类型的信息转换为另一种不同类型的信息之后,确定利用逆向的转换过程将该信息转换回原始信息的可能性,继而至少部分地基于该可能性来更新互逆的转换过程中的至少一个。此种方式仅使用两种类型信息的未标注数据来训练,而无需两种类型信息的对齐的平行数据,从而既提高了训练效率,又显著降低了学习成本。
-
公开(公告)号:CN107818076B
公开(公告)日:2021-11-12
申请号:CN201610818984.3
申请日:2016-09-12
Applicant: 微软技术许可有限责任公司
Abstract: 在本公开的实施例中,提出了一种针对自然语言的语义处理的方法和设备。在获得包括多个项目的项目集之后,确定每个项目在一组语义维度上的一个量化表示和在另一组维度上的另一量化表示,然后使用这两组维度上的量化表示来生成每个项目的语义值。根据本公开的实施例,语义值能够用于确定项目集中的不同项目之间的语义相关性,并且每个量化表示可以由项目集中的多个项目共享。因此,通过使得多个项目共享同一量化表示,本公开在针对自然语言的语义处理过程中,不仅能够有效减小语义模型的大小,而且能够显著提高语义处理的速度。
-
公开(公告)号:CN107818076A
公开(公告)日:2018-03-20
申请号:CN201610818984.3
申请日:2016-09-12
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/2785 , G06N3/0445 , G06N3/08
Abstract: 在本公开的实施例中,提出了一种针对自然语言的语义处理的方法和设备。在获得包括多个项目的项目集之后,确定每个项目在一组语义维度上的一个量化表示和在另一组维度上的另一量化表示,然后使用这两组维度上的量化表示来生成每个项目的语义值。根据本公开的实施例,语义值能够用于确定项目集中的不同项目之间的语义相关性,并且每个量化表示可以由项目集中的多个项目共享。因此,通过使得多个项目共享同一量化表示,本公开在针对自然语言的语义处理过程中,不仅能够有效减小语义模型的大小,而且能够显著提高语义处理的速度。
-
公开(公告)号:CN103136310B
公开(公告)日:2017-11-28
申请号:CN201110413826.7
申请日:2011-12-02
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。每个特定网站有自己的内容偏好和自己的用户群。当用户在某个网站进行查询,该查询与多数情况与该网站内容相关。本发明利用在该网站的历史搜索信息对可能有歧义的原始查询进行转换。之后基于该替代查询在广告引擎中进行搜索,再将搜索到的广告返回给用户,从而使得真正用于广告搜索的查询项与该网站的目标业务更加匹配,同时使得广告结果与用户的搜索意图更匹配。
-
公开(公告)号:CN107798386B
公开(公告)日:2022-02-15
申请号:CN201610837511.8
申请日:2016-09-01
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的实施例涉及基于未标注数据的多过程协同训练。在利用一个转换过程将一种类型的信息转换为另一种不同类型的信息之后,确定利用逆向的转换过程将该信息转换回原始信息的可能性,继而至少部分地基于该可能性来更新互逆的转换过程中的至少一个。此种方式仅使用两种类型信息的未标注数据来训练,而无需两种类型信息的对齐的平行数据,从而既提高了训练效率,又显著降低了学习成本。
-
公开(公告)号:CN113948064A
公开(公告)日:2022-01-18
申请号:CN202010620533.5
申请日:2020-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了用于语音合成和语音识别的方案。根据该方案,支持至少一种语言的语音合成(TTS)模型和自动语音识别(ASR)模型被获取。基于目标语言的第一组配对数据来调整该TTS模型和ASR模型,以支持目标语言。然后,基于第一组配对数据和由ASR模型生成的该目标语言的第一组合成配对数据来优化该TTS模型,同时基于第一组配对数据和由TTS模型生成的该目标语言的第二组合成配对数据来优化该ASR模型。以此方式,该方案能够利用较少的训练数据为缺乏训练数据的语言提供具有较高准确性的TTS模型和ASR模型。
-
-
-
-
-
-
-
-