-
公开(公告)号:CN118334242A
公开(公告)日:2024-07-12
申请号:CN202410427179.2
申请日:2024-04-10
Applicant: 浙江大学
IPC: G06T17/00 , G06Q10/087
Abstract: 本发明公开了一种基于分层强化学习的出口集装箱堆场存储位置分配方法,该将即时翻箱率和即时箱区均衡度作为奖励函数的元素,使得出口集装箱排序过程、箱区分配过程和箱位分配过程中充分考虑到堆场内同一航线出口集装箱的均衡分布情况和翻箱情况,降低了后续出口集装箱的装载难度,提升了堆场的并行效率,减少船舶装箱时间。
-
公开(公告)号:CN119646140A
公开(公告)日:2025-03-18
申请号:CN202411673706.4
申请日:2024-11-21
Applicant: 浙江大学
IPC: G06F16/3329 , G06F16/334 , G06F16/34 , G06N5/04 , G06F40/35 , A63F13/822
Abstract: 本发明公开了一种基于人设背景大语言模型的角色扮演聊天机器人实现方法,包括:收集大量文学作品的文本数据,利用大模型提取角色对话、动作及摘要,同时提取角色设定信息;从角色对话中提取双人多轮对话,与角色设定匹配,形成初步数据集;将初步数据集转换为Json格式,构建结构化的多轮对话数据集;采用LoRA方法和DPO方法对大语言模型进行微调;基于微调后的大语言模型构建聊天机器人,整合角色信息、背景故事、历史对话摘要及少量示例对话,形成动态提示词框架;为聊天机器人构建智能聊天框架,包括时间计划模块、主动推送模块和延迟聊天模块。利用本发明,可有效提升对话质量、角色个性化、角色一致性、交互连贯性及用户体验。
-
公开(公告)号:CN119047671A
公开(公告)日:2024-11-29
申请号:CN202411011372.4
申请日:2024-07-26
Applicant: 浙江大学
IPC: G06Q10/047 , G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种基于深度强化学习的大规模旅行商问题求解方法,包括:(1)将大规模旅行商问题建模为马尔科夫决策过程;(2)随机生成一系列大规模旅行商问题实例并进行数据增强,得到训练数据;(3)构建基于端到端深度强化学习的大规模旅行商问题求解模型架构,该模型包括编码器和解码器,编码器采用快速注意力机制作为注意力层,解码器使用一个特殊的上下文节点来表示当前的解码状态;(4)设计决策网络,训练模型;决策网络选择REINFORCE,利用深度强化学习方法中的对称性对REINFORCE算法进行改进;(5)利用训练好的模型进行旅行商问题求解,并对求解结果进行优化。本发明可以解决大规模旅行商问题求解中时间效率和内存占用的双重挑战。
-
公开(公告)号:CN119292342A
公开(公告)日:2025-01-10
申请号:CN202411654924.3
申请日:2024-11-19
Applicant: 浙江大学
IPC: G05D1/695 , G05D109/20
Abstract: 本发明公开了一种基于深度多智能体强化学习的无人机集群协同搜索方法及系统,包括:定义追踪者无人机、侦察者无人机和智能目标无人机;为每个无人机智能体初始化行动者网络、评论家网络和经验回放缓冲区;每个无人机智能体根据当前状态,通过其行动者网络选择动作并执行,当环境返回新的状态和对应的奖励后,将交互经验存储到经验回放缓冲区;从经验回放缓冲区中随机抽取一批经验样本,更新评论家网络;使用评论家网络来计算梯度,根据这些梯度更新每个智能体的行动者网络;持续进行智能体的交互、数据收集、网络训练和目标网络更新,直至达到一定的训练周期或性能标准。本发明可以提高无人机集群在复杂环境中执行协同搜索任务的效率和安全性。
-
公开(公告)号:CN118332417A
公开(公告)日:2024-07-12
申请号:CN202410427181.X
申请日:2024-04-10
Applicant: 浙江大学
IPC: G06F18/2411 , G06N3/126 , G06F18/214
Abstract: 本发明公开了一种基于深度强化学习的船舶配载方法,本发明通过退火遗传算法对历史配载数据进行操作得到大量的,较为准确的集装箱‑箱位映射关系,从而提供了大量的标签,同时将集装箱和箱位的空间信息和特征信息进行池化、卷积操作得到包含空间信息、特征信息和与其他集装箱相关联信息的嵌入向量,将该标签和嵌入向量作为训练样本,通过监督学习能够较好的训练出能够较为准确的预测集装箱‑箱位映射关系的演员网络,本发明还基于预测的集装箱‑箱位映射关系构建有向无环图,基于构建的有向无环图能够准确得到集装箱的配载顺序,综上两点本发明提供的方法能够在合理的时间内得到船舶配载问题的最优解,且复用性较高,本发明还公开了一种基于深度强化学习的船舶配载装置。
-
公开(公告)号:CN119576557A
公开(公告)日:2025-03-07
申请号:CN202411655809.8
申请日:2024-11-19
Applicant: 浙江大学
Abstract: 本发明公开了一种基于安全强化学习的云资源动态调度方法,包括:将每个应用需求抽象为一个有向无环图,每一个作业阶段用节点表示,每一条边表示作业阶段之间的数据依赖;将计算资源的动态调度问题建模为马尔科夫决策过程,构建强化学习策略模型,定义状态、动作和奖励;强化学习策略模型包含图神经网络和决策网络,决策网络接收图神经网络的输出,并生成选择调度的任务节点和资源分配上限;以奖励最大化为目标对强化学习策略模型进行训练;训练完成后,对于当前时间步,结合实时获取的计算集群的状态,按顺序计算每一个决策步要调度的任务节点和实际分配的计算资源。利用本发明,可以实现更高效的资源调度,提高了计算资源的利用效率。
-
公开(公告)号:CN119166779A
公开(公告)日:2024-12-20
申请号:CN202411254720.0
申请日:2024-09-09
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/36 , G06F16/35 , G06F40/186 , G06F30/12
Abstract: 本发明公开了一种基于大语言模型的CAE求解器文件格式通用转换系统,包括LLM分析转换模块,应用ChatGLM理解转换指令,查询调用知识存储模块并结合文档知识图谱生成目标文件内容;知识存储模块,存储CAE求解器的文件格式模板、文档知识图谱等;图检索模块,快速索引文件格式转换任务过程中当下主题格式转换相关的文档知识图谱子图,结合转换算法定位转换任务关键词主题;转换算法模块,实现文档知识图谱中新转换路径的构建与存储、结合图检索模块实现转换任务关键词主题的确定与定位,完成转化内容填充。利用本发明,能够解决传统CAE求解器文件格式转换中开发技术门槛高、可扩展性差、进行1转N与N转1困难、转换后需要大量人工干预校核等问题。
-
-
-
-
-
-