-
公开(公告)号:CN119990337A
公开(公告)日:2025-05-13
申请号:CN202510466856.6
申请日:2025-04-15
Applicant: 之江实验室
IPC: G06N5/04 , G06N3/063 , G06N3/0464
Abstract: 本申请涉及一种模型推理加速方法、系统、计算机设备和可读存储介质。方法包括:获取待处理模型的模型文件;解析待处理模型文件,得到待处理模型的所有算子;若不存在物理加速卡,则将模型文件加载至CPU的内存空间,从用户态预设的虚拟算子库中确定与所有算子匹配的目标算子;将各算子映射至各自对应的目标算子,基于目标算子加速待处理模型推理。采用本方法能够提高资源利用率。
-
公开(公告)号:CN116151355B
公开(公告)日:2023-07-11
申请号:CN202310422202.4
申请日:2023-04-19
Applicant: 之江实验室
IPC: G06N3/08 , G06N3/0455 , G06N3/0442 , G06F40/295
Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。
-
公开(公告)号:CN115248692A
公开(公告)日:2022-10-28
申请号:CN202211148564.0
申请日:2022-09-21
Applicant: 之江实验室
Abstract: 本发明公开了一种支持多种深度学习框架模型的云端部署装置及方法,将模型以线上服务的形式部署在云端服务器,支持使用http和gRPC两种通信协议提供在线推理服务,包括如下步骤:步骤一、根据方法说明部署模型云端部署装置及网关装置;步骤二、训练待部署的模型,并保存为其所使用的深度学习框架对应的可支持部署的模型格式;步骤三、根据模型采用的深度学习框架及方法中提供的必要的依赖包,制作可支持模型部署的镜像;步骤四、根据装置页面要求选择合适的参数将该模型进行云端部署。本发明操作简单,用户无须精通算法即可在本装置中同时部署多种深度学习框架训练的模型,且易于扩展,同时支持其他深度学习框架模型部署。
-
公开(公告)号:CN116258679A
公开(公告)日:2023-06-13
申请号:CN202310004631.X
申请日:2023-01-03
IPC: G06T7/00 , G06V10/764 , G06N3/08 , G06V10/82
Abstract: 本说明书公开了一种信息推荐方法、装置、存储介质及电子设备,本说明书实施例在获取针对用户的病灶部位所采集的图像之后,将图像输入到分类模型中,通过分类模型确定出各特征数据,并确定每个特征数据归属于每种症状的概率。基于每个特征数据归属于每种症状的概率和每个特征数据,确定每种症状对应的症状特征。将每种症状对应的症状特征进行拼接得到综合症状特征,并基于综合症状特征识别出用户所患的疾病。在此方法中,可以将病灶处的各症状进行解耦,得到每种症状的症状特征,再基于每种症状的症状特征确定出患者所患的疾病,这样可以有效提高对相似症状的疾病进行分类的准确性。
-
公开(公告)号:CN115242882B
公开(公告)日:2023-01-10
申请号:CN202211140330.1
申请日:2022-09-20
Applicant: 之江实验室
IPC: H04L67/63 , H04L61/4511 , H04L67/56 , H04L67/141 , H04L9/40
Abstract: 本发明公开了一种基于传输层路由访问k8s容器环境的方法及装置,应用于容器云平台,获取客户端的基于域名和固定端口的连接请求;通过域名解析服务器,将连接请求解析并根据固定端口,转发到相应的代理服务器上;代理服务器根据预设的域名和容器集群目标节点的映射关系,将连接请求转发到目标节点;根据预设的认证方式,建立网络连接。本发明实现多租户的传输层路由,为开发人员提供基于安全外壳协议的容器环境访问方式,本发明只对外暴露预先设定的代理服务器的固定端口,避免了kubernetes集群中容器组IP或Service端口的外泄,有效提升了容器云平台的安全性。
-
公开(公告)号:CN116975253A
公开(公告)日:2023-10-31
申请号:CN202310750125.5
申请日:2023-06-25
IPC: G06F16/34 , G06T11/20 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于Transformer自注意力的可视分析方法及装置。本发明通过可视分析图表了解深度学习模型的训练层及注意力头的自注意力的整体分布情况及统计规律,并可通过数据链接图和矩阵图具体训练样本查看自注意力在实例中的联系情况;计算机视觉领域的注意力可视分析揭示在训练任务中像素块之间的相互关注性,通过全局归一化和局部归一化两种方式查看不同层和头之间的自注意力分布情况,获得下游任务得出结果的过程。通过本发明,研究人员利用统计分析图表,可直观地观察Transformer模型内部注意力头的值分布情况,选择感兴趣的注意力头。且通过具体的单个注意力头可视化,研究人员可以分析注意力头在具体任务中所发挥的作用,帮助研究人员改进优化模型。
-
公开(公告)号:CN116151355A
公开(公告)日:2023-05-23
申请号:CN202310422202.4
申请日:2023-04-19
Applicant: 之江实验室
IPC: G06N3/08 , G06N3/0455 , G06N3/0442 , G06F40/295
Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。
-
公开(公告)号:CN115731433A
公开(公告)日:2023-03-03
申请号:CN202211503704.1
申请日:2022-11-28
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 一种基于模型权重混合的在线知识蒸馏方法及系统,包括:1)服务端收集标注数据,划分为训练集和验证集;2)选取N个相同架构的学生模型,并通过线性加权学生参数构建权重混合模型;3)选取数据增强将训练集扩充成N+1份,分别输入N个学生和权重混合模型中,得到N+1个预测输出以及他们的平均集成预测;4)计算每个学生和权重混合模型的分类损失;5)计算每个学生输出与集成预测之间的知识蒸馏损失;6)计算每个学生的参数优化目标并更新N个学生的参数;7)重复3‑6步骤,每个轮次后根据更新后的学生重新构建混合权重模型,并每隔固定轮次Δ,将混合权重模型的参数融合到学生中;8)选取验证集上表现最优的模型部署到终端设备上。
-
公开(公告)号:CN115242882A
公开(公告)日:2022-10-25
申请号:CN202211140330.1
申请日:2022-09-20
Applicant: 之江实验室
IPC: H04L67/63 , H04L61/4511 , H04L67/56 , H04L67/141 , H04L9/40
Abstract: 本发明公开了一种基于传输层路由访问k8s容器环境的方法及装置,应用于容器云平台,获取客户端的基于域名和固定端口的连接请求;通过域名解析服务器,将连接请求解析并根据固定端口,转发到相应的代理服务器上;代理服务器根据预设的域名和容器集群目标节点的映射关系,将连接请求转发到目标节点;根据预设的认证方式,建立网络连接。本发明实现多租户的传输层路由,为开发人员提供基于安全外壳协议的容器环境访问方式,本发明只对外暴露预先设定的代理服务器的固定端口,避免了kubernetes集群中容器组IP或Service端口的外泄,有效提升了容器云平台的安全性。
-
-
-
-
-
-
-
-