-
公开(公告)号:CN107798386B
公开(公告)日:2022-02-15
申请号:CN201610837511.8
申请日:2016-09-01
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的实施例涉及基于未标注数据的多过程协同训练。在利用一个转换过程将一种类型的信息转换为另一种不同类型的信息之后,确定利用逆向的转换过程将该信息转换回原始信息的可能性,继而至少部分地基于该可能性来更新互逆的转换过程中的至少一个。此种方式仅使用两种类型信息的未标注数据来训练,而无需两种类型信息的对齐的平行数据,从而既提高了训练效率,又显著降低了学习成本。
-
公开(公告)号:CN113948064A
公开(公告)日:2022-01-18
申请号:CN202010620533.5
申请日:2020-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了用于语音合成和语音识别的方案。根据该方案,支持至少一种语言的语音合成(TTS)模型和自动语音识别(ASR)模型被获取。基于目标语言的第一组配对数据来调整该TTS模型和ASR模型,以支持目标语言。然后,基于第一组配对数据和由ASR模型生成的该目标语言的第一组合成配对数据来优化该TTS模型,同时基于第一组配对数据和由TTS模型生成的该目标语言的第二组合成配对数据来优化该ASR模型。以此方式,该方案能够利用较少的训练数据为缺乏训练数据的语言提供具有较高准确性的TTS模型和ASR模型。
-
公开(公告)号:CN113870104A
公开(公告)日:2021-12-31
申请号:CN202010621955.4
申请日:2020-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了用于超分辨率图像重建的方案。根据该方案,具有第一分辨率的输入图像被获取。利用输入图像训练来可逆神经网络,其中可逆神经网络被配置为基于输入图像生成具有第二分辨率的中间图像和第一高频信息,并且第二分辨率低于第一分辨率。随后,利用经训练的可逆神经网络的逆网络,基于输入图像和服从预定分布的第二高频信息来生成具有第三分辨率的输出图像,其中第三分辨率高于第一分辨率。该方案能够有效地处理由未知降采样方法获得的低分辨率图像,从而获得高质量的高分辨率图像。
-
公开(公告)号:CN107784364B
公开(公告)日:2021-06-15
申请号:CN201610730381.8
申请日:2016-08-25
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的实施例涉及机器学习模型的异步训练。服务器从工作机接收通过对机器学习模型进行训练而生成的反馈数据。这些反馈数据是工作机利用自己的训练数据获得的,并且与该机器学习模型的参数集在这个特定工作机处的先前值相关联。服务器确定所述先前值与参数集在服务器处的当前值之间的差异。这个当前值可能是由于其他工作机的操作而经过了一次或多次的更新。继而,服务器可以基于反馈数据和参数集的值之间的差异,来更新参数集的当前值。由此,这种更新不仅考虑了每个工作机的训练结果,还对不同工作机之间的延迟做出了适当的补偿。
-
公开(公告)号:CN110427351A
公开(公告)日:2019-11-08
申请号:CN201810395943.7
申请日:2018-04-27
Applicant: 微软技术许可有限责任公司
IPC: G06F16/21
Abstract: 在本公开的实施例中,提出了一种针对数据集的主动式数据建模的方法、设备以及计算机程序产品。针对给定数据集,主动地选择第一子集以生成至少以第一变量为自变量的第一模型,并且主动地选择第二子集以生成至少以第二变量为自变量的第二模型。然后,将第一模型和第二模型进行合并,以生成指示数据集中的数据约束条件的目标模型,以用于基于数据集进行预测。在本公开的实施例中,主动地选择多个数据子集以便针对多个自变量生成多个模型,并且合并多个模型以生成最终的目标模型。因此,本公开的实施例能够减少建模过程中的自变量的数目,从而有效提高针对数据集的建模效率。
-
公开(公告)号:CN119317904A
公开(公告)日:2025-01-14
申请号:CN202280096642.9
申请日:2022-06-22
Applicant: 微软技术许可有限责任公司
IPC: G06F11/3668 , G06N3/006 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/088 , G06N3/09 , G06N3/092
Abstract: 一种用于基于像素的自动化测试的计算系统,自动化测试用于测试可导航模拟环境,计算系统包括一个或多个处理器,一个或多个处理器被配置为在运行时推理阶段执行应用测试程序。应用测试程序包括被训练为检测被测应用中的错误的机器学习模型。模拟环境的屏幕图像由对象检测模块处理以确定屏幕图像中是否存在关键对象。如果屏幕图像中存在关键对象,则应用测试程序执行对象调查模块,以生成用以调查关键对象的调查输入。如果屏幕图像中不存在关键对象,则应用测试程序执行环境探索模块,以生成环境探索动作,环境探索动作将被提供给待测应用作为模拟用户输入。
-
公开(公告)号:CN110555542B
公开(公告)日:2023-06-02
申请号:CN201810552780.9
申请日:2018-05-31
Applicant: 微软技术许可有限责任公司
IPC: G06Q10/04 , G06Q10/087 , G06Q10/0835
Abstract: 根据本公开的实现,提出了一种用于资源的库存控制的方案。在该方案中,获取关于多个地点的路径信息。该路径信息指示在多个时间点中的特定时间点处从多个地点中的一个地点出发的第一路径和在该特定时间点处到达该地点的第二路径。然后,确定针对在特定时间点在该地点处的资源的第一数量的至少一个约束以及与至少一个约束相关联的相应惩罚。基于至少一个约束和相应惩罚,来确定与多个时间点处的多个地点相关联的惩罚的和。确定经由第二路径向该地点运送的资源的第二数量和经由第一路径从该地点运出的资源的第三数量,以使得惩罚的和最小。通过该方案,能够在各个地点处保持合适的资源的库存水平,从而在满足客户需求的同时节省不必要的成本。
-
公开(公告)号:CN115602145A
公开(公告)日:2023-01-13
申请号:CN202110721773.9
申请日:2021-06-28
Applicant: 微软技术许可有限责任公司(US)
IPC: G10L13/08
Abstract: 根据本公开的实现,提出了一种基于文本生成语音的方案。在该方案中,生成与文本对应的初始音素序列,初始音素序列包括多个音素的特征表示。通过在初始音素序列中插入附加音素的特征表示来生成第一音素序列,附加音素与自然口语的特性有关。通过利用与多个音素和附加音素中的音素对应的专家模型来确定音素的持续时间,基于第一音素序列来生成第二音素序列。基于第二音素序列,确定与文本对应的自然口语类型的语音。以此方式,该方案能够基于自然口语类型的附加音素和多个专家模型来生成具有多变韵律的更真实的自然口语类型的语音。
-
公开(公告)号:CN115547278A
公开(公告)日:2022-12-30
申请号:CN202110732470.7
申请日:2021-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于说唱生成的方案。在该方案中,获取与说唱的第一部分相对应的输入序列。在输入序列中,第一部分的同一语句中的各个词按逆序排列,并且第一部分的节拍的节拍标识与对应于节拍的词相邻。确定分别与输入序列相对应的文本表示序列和押韵表示序列。基于文本表示序列和押韵表示序列,根据说唱生成模型,生成说唱的第二部分。以此方式,可以生成既押韵又具有节奏的说唱。
-
-
-
-
-
-
-
-
-