页面处理方法及装置、页面处理系统

    公开(公告)号:CN115358824A

    公开(公告)日:2022-11-18

    申请号:CN202211033484.0

    申请日:2022-08-26

    Abstract: 本说明书实施例提供了页面处理方法及装置、页面处理系统,该方法包括响应于客户端发送的交易处理请求创建交易订单,根据所述交易订单确定目标展示对象;根据所述目标展示对象生成待展示页面,并建立所述待展示页面与所述交易订单的订单标识的关联关系;将所述待展示页面以及、所述待展示页面与所述交易订单的订单标识的关联关系发送至客户端。通过在接收到客户端发送的交易处理请求创建交易订单、但未完成该交易订单的支付前,生成待展示页面(如商家的营销内容),并将该待展示页面发送至客户端进行渲染;使得客户端在完成该交易订单的支付后可以及时为用户展示该待展示页面,增强其待展示页面的曝光率。

    大模型推理加速的方法和系统
    2.
    发明公开

    公开(公告)号:CN120087476A

    公开(公告)日:2025-06-03

    申请号:CN202510159505.0

    申请日:2025-02-13

    Abstract: 本说明书提供一种大模型推理加速的方法和系统,其中,大模型的推理过程包括多个阶段,不同阶段对应不同的量化模型,量化模型为对预先训练好的原始大模型进行量化处理得到的。该方法包括:获得推理请求,推理请求用于请求基于原始大模型对待推理信息进行推理,基于各阶段各自对应的量化模型对待推理信息进行推理,得到并输出目标推理结果。其中,多个阶段包括Prefill阶段和Decode阶段,Prefill阶段对应的量化模型为经第一量化方案得到的第一量化模型,Decode阶段对应的量化模型为经第二量化方案的第二量化模型,且第一量化方案和第二量化方案分别是基于相应阶段对应的推理需求确定的。可以达到降本增效的技术效果。

Patent Agency Ranking