-
公开(公告)号:CN118586440A
公开(公告)日:2024-09-03
申请号:CN202410649049.3
申请日:2024-05-23
Applicant: 河钢数字技术股份有限公司
IPC: G06N3/045 , G06N3/082 , G06N3/0464 , G06N3/09 , G06V10/82 , G06V10/771
Abstract: 本发明公开了基于梯度的Transformer模块化分解方法,涉及图像处理和计算机视觉技术领域,该基于梯度的Transformer模块化分解方法,包括以下步骤:步骤一:目标点识别,如算法1描述了基于梯度技术识别单个注意力头中的非目标节点;步骤二;存储不属于目标类模块的节点位置;步骤三:添加非目标类;步骤四:目标类模块化,将事先训练好的Transformer模型分解为一组更小且可重用的模块,通过这一独特的分解过程,生成的模块能够被灵活地重用,以构建全新的、甚至更加精准的Transformer模型,而无需从头开始进行昂贵的训练。这种模块化分解方法不仅提高了模型的灵活性和可重用性,同时降低了模型开发的成本和时间,为深度学习模型的定制和优化提供了一种高效而创新的途径。
-
公开(公告)号:CN119938820A
公开(公告)日:2025-05-06
申请号:CN202411792188.8
申请日:2024-12-06
Applicant: 河钢数字技术股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 本申请涉及一种基于RAG的智能知识库管理的方法,包括如下步骤:S1、问题检索,S11、问题向量化处理,将用户提问转换为数值向量,系统使用和文本数据相同的预训练的语言模型对问题进行编码,使问题向量化;S12、向量相似性检索;S2、构建知识库,S21、数据提取阶段,即从原始数据源提取知识内容;S22、文档切分,拆分文本数据为词块内容;S23、向量化;S3、答案生成。本申请实施例提供的整体系统,通过利用本系统快速构建向量数据库,实现数据检索,并配合大语言模型生成符合逻辑且完整的答案,大幅缩减了特定领域问题系统的开发周期,极大地方便了用户检索特定问题的时间,使系统回答问题更具备逻辑性和完整性。
-
公开(公告)号:CN117193841A
公开(公告)日:2023-12-08
申请号:CN202311171922.4
申请日:2023-09-12
Applicant: 河钢数字技术股份有限公司 , 河钢雄安数字科技有限公司 , 西安电子科技大学
IPC: G06F8/71 , G06F9/445 , G06F18/214
Abstract: 本申请适用于参数调优技术领域,提供了一种软件系统的配置参数调优方法及装置,包括:获取软件系统的调优目标和成本模型;成本模型包括对调优目标的成本约束;基于调优目标确定具有配置结构感知的调优模型;针对调优目标,对软件系统的配置参数进行预采样,并对预采样的配置参数所产生的性能进行测量,获得公开离线数据;基于成本模型和公开离线数据,对调优模型进行离线训练,获得调优目标的收敛效果在预设阈值范围内的调优模型的超参数组合;基于超参数组合,将调优模型与软件系统进行在线实时交互,得到软件系统的目标配置参数。本申请能够在未知的内部约束的情况下,进行配置调优。
-
-