一种从文件中提取数据微调大语言模型的方法

    公开(公告)号:CN118585497A

    公开(公告)日:2024-09-03

    申请号:CN202410740264.4

    申请日:2024-06-07

    Abstract: 本发明公开了一种从文件中提取数据微调大语言模型的方法,涉及软件开发技术领域,一种从文件中提取数据微调大语言模型的方法,此方法使得用户在前台可视化界面上传文件,后台服务端自动将文件的内容提取并生成训练数据推送至大语言模型中,通过编写前台可视化界面实现用户任意文件的上传下载功能,使用Java搭建后台服务端将文件包含内容提取并存储,支持文件格式有Word、Excel、Pdf等十余种;之后将文件内容清洗并按分隔符分割成一条条的语句,再根据实际的大语言模型训练场景需要将语句拼接为大小合适的段落;将段落的关键词提取出来并保存,使用Python搭建执行微调大语言模型的训练服务,接成完整报文推送给训练服务,执行具体的大语言模型训练工作。

    一种基于报表多维分析的数据可视化分析平台

    公开(公告)号:CN118260355A

    公开(公告)日:2024-06-28

    申请号:CN202211644259.0

    申请日:2022-12-20

    Abstract: 本发明公开了一种基于报表多维分析的数据可视化分析平台,包括数据准备模块、数据处理模块、可视化展示模块、数据分析模块、组件、动态交互设置模块、报表管理模块;所述数据准备模块用于将数据库数据集和SQL数据集添加到平台;所述数据处理模块和平台通信连接,对数据集进行基础的数据处理;本发明的有益效果是:以类Excel操作方式对数据进行分析前的处理;提供“选择字段”、“筛选”、“排序”、“字段设置”多种数据处理功能,用户通过数据处理可以实现想要的结果;支持多种数据源采集与绑定,通过数字化的手段对实体对象作业过程、产生数据进行动态分析、展示;以数据形式为企业生产现状进行分析,为企业后续发展提供支撑运维,辅助领导决策。

    一种大数据集群部署方法、装置、电子设备及存储介质

    公开(公告)号:CN116610327A

    公开(公告)日:2023-08-18

    申请号:CN202310341273.1

    申请日:2023-03-31

    Abstract: 本发明提供一种大数据集群部署方法、装置、电子设备及存储介质。该方法包括确定待部署的目标组件。监测多个节点的各资源的实时使用率。查询预设权重表获得各类型资源对目标组件的影响权重,其中影响权重用于表示目标组件对该类型硬件配置资源的需求程度。基于各类型硬件配置资源对目标组件的影响权重,获得目标组件在各节点的负载分值。基于目标组件在各节点的负载分值,将目标组件部署在负载分值最低的节点上。本发明能够通过基于组件对各类型资源的需求权重计算目标组件在各节点的负载分值,并将目标组件部署在负载分值最低的节点上,避免较多服务集中在某一个节点上,造成该节点资源紧张而其他节点资源空闲,提升了大数据集群资源利用率。

    基于切面编程的自动补偿方法、设备及存储介质

    公开(公告)号:CN116126303A

    公开(公告)日:2023-05-16

    申请号:CN202310138677.0

    申请日:2023-02-20

    Abstract: 本发明提供基于切面编程的自动补偿方法、设备及存储介质,该方法包括:响应于目标切点的应用请求,触发目标任务;其中,目标任务是与目标切点相对应的任务,目标切点为基于切面编程在项目中设置的多个预设切点中的任意一个切点,目标切点的参数至少包括补偿次数阈值和补偿时间间隔集合;在目标任务的执行结果显示为失败时,基于补偿时间间隔集合和补偿执行次数,自动触发目标任务。本发明可以通过在与目标任务对应的目标切点中预先定义了补偿次数阈值和补偿时间间隔集合,当捕获到执行结果为失败时,即可自动对目标任务进行重试或补偿,不会对目标任务有侵入,提高了处理的灵活性。

    一种基于多任务增益回归的废钢异物扣重学习方法

    公开(公告)号:CN115034326A

    公开(公告)日:2022-09-09

    申请号:CN202210710798.3

    申请日:2022-06-22

    Abstract: 本发明公开了一种基于多任务增益回归的废钢异物扣重学习方法,采用MTSN预测模型,并采用Embedding模块实现数据连续向量表示,采用层级条件下的多层感知网络实现数据学习,分别生成认知数据损失度量和离散废钢等级数据的损失度量,最后采用MTL多任务自动学习权重机制,关注相关性大的变量,弱化相关性小的变量,实现自动调节权重系数;本发明中的多层级回归网络,根据数据类型的不同,分别训练,对具有不确定性影响力的数据,单独计算特征影响因子,提高数据的表征能力,能够解决数据表征能力差的问题;本发明中的数据增益网络,初始化权重,计算数据预测参数,迭代训练,转化权重系数为增益系数。

    一种基于动态建表的表单设计器
    19.
    发明公开

    公开(公告)号:CN119938014A

    公开(公告)日:2025-05-06

    申请号:CN202411792190.5

    申请日:2024-12-06

    Abstract: 本申请涉及一种基于动态建表的表单设计器,包括组件功能模块、拖拽组件进行画布绘制模块、组件属性配置模块、表单属性配置模块、表单主题样式模块、表单功能模块、组件数据权限校验模块、表单保存后根据表单配置模块和数据库动态生成表结构及其字段模块。本申请实施例提供的整体结构,通过在线可视化拖拽操作生成表单和动态生成数据库表结构,解决了现有技术中高人力成本、时间消耗大、高专业技术要求和系统问题频发的缺陷。通过提供丰富的组件功能,包括密码框、金额框、富文本编辑器和日期选择器等,增强了系统的灵活性和功能性。右侧属性面板允许用户配置组件属性,并支持数据唯一性校验和正则校验,提高了表单数据的准确性和安全性。

Patent Agency Ranking