-
公开(公告)号:CN110728350B
公开(公告)日:2024-07-26
申请号:CN201810715757.7
申请日:2018-06-29
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于机器学习模型的量化的方案。在该方案中,获得机器学习模型中的处理单位所使用的处理参数的当前值。基于预定数目的基础量化参数的当前值和特定于处理参数的二值量化参数的当前值来量化处理参数的当前值,以获得处理参数的量化值,二值量化参数与基础量化参数分别对应,并且预定数目与用于量化的比特数目相同。基于处理参数的量化值与处理参数的当前值之间的差异,更新基础量化参数的当前值和二值量化参数的当前值,以用于特定于处理参数的量化。以此方式,不仅能够获得由网络量化带来的存储和处理开销的降低,而且还能进一步提高量化准确度。
-
公开(公告)号:CN109948044A
公开(公告)日:2019-06-28
申请号:CN201711343103.8
申请日:2017-12-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F16/958
Abstract: 本文公开的基于向量最近邻搜索的文档查询的技术方案,将向量近似匹配检索技术应用到搜索引擎中,通过将查询内容和网页文档分别进行语义向量化后,利用向量近似匹配检索的方式,获取与查询内容接近的网页文档,从而能够突破符号匹配的检索方式的限制,提供能够更好地把握用户意图的检索服务。
-
公开(公告)号:CN110728350A
公开(公告)日:2020-01-24
申请号:CN201810715757.7
申请日:2018-06-29
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于机器学习模型的量化的方案。在该方案中,获得机器学习模型中的处理单位所使用的处理参数的当前值。基于预定数目的基础量化参数的当前值和特定于处理参数的二值量化参数的当前值来量化处理参数的当前值,以获得处理参数的量化值,二值量化参数与基础量化参数分别对应,并且预定数目与用于量化的比特数目相同。基于处理参数的量化值与处理参数的当前值之间的差异,更新基础量化参数的当前值和二值量化参数的当前值,以用于特定于处理参数的量化。以此方式,不仅能够获得由网络量化带来的存储和处理开销的降低,而且还能进一步提高量化准确度。
-
公开(公告)号:CN110110186A
公开(公告)日:2019-08-09
申请号:CN201810064350.2
申请日:2018-01-23
Applicant: 微软技术许可有限责任公司
IPC: G06F16/953 , G06F16/22
Abstract: 公开的空间划分树与邻近图结合的向量检索技术,综合利用了空间划分树和基于邻近图这两种技术,构建出的一种基于联合索引的向量检索方案,先利用空间划分树索引进行粗粒度定位,然后再利用邻近图索引进行进一步向量检索,从而提高向量检索的效率。
-
-
-