一种基于分层内在激励的多AGV智能调度方法

    公开(公告)号:CN116466662A

    公开(公告)日:2023-07-21

    申请号:CN202310346390.7

    申请日:2023-04-03

    Abstract: 本发明涉及一种基于分层内在激励的多AGV智能调度方法,首先,基于多AGV车间搬运场景,建立部分可观测的马尔科夫决策模型;其次,提出分层内在激励机制,用于实时调整AGV的两种内在激励权重;之后,基于多智能体深度强化学习方法BicNet进行训练,最终将训练好的策略网络部署到每个AGV,进行多AGV智能调度。本发明提出了基于多智能体强化学习的调度方法,各个AGV可以基于策略网络进行自组织地智能调度,提高了多AGV的自主调度能力与任务完成水平,为实现多AGV的自学习、自组织的智能调度提供了解决方案。

    一种上下文感知的深度学习模型自适应量化方法

    公开(公告)号:CN116227333A

    公开(公告)日:2023-06-06

    申请号:CN202211677086.2

    申请日:2022-12-26

    Abstract: 本发明涉及一种上下文感知的深度学习模型自适应量化方法,引入长短期记忆网络作为门控网络,在运行时感知深度学习模型的上下文预算变化,然后动态调整不同资源预算的深度学习模型门控网络,并在运行时由门控网络根据不同输入逐层动态调整深度学习模型的量化位宽。通过本发明提供的这种方法,模型完成对动态上下文预算的自适应。通过实时感知上下文的环境变化,为模型量化位宽的改变提供约束。并且通过采用门控网络产生量化位宽的方式大幅度降低搜索深度学习模型量化位宽的资源消耗并实现模型量化的动态自适应。

    一种基于人机协作的医疗诊断方法及系统

    公开(公告)号:CN115132350A

    公开(公告)日:2022-09-30

    申请号:CN202210693972.8

    申请日:2022-06-19

    Abstract: 本发明涉及一种基于人机协作的医疗诊断方法及系统,它使用BERT+CRF在患者对话中识别患者已有的症状,并使用基于DQN的方法让机器选择下一个需要和患者询问并确认的症状。机器获得患者症状后,结合知识库,计算患者患某种疾病的概率并生成患者电子病历。人类医生介入结合机器问诊结果进行复诊,给出最终诊断结果。该方法有效地结合了机器智能与人类智能,由机器代替人类医生进行症状询问,极大地减少了人类医生的工作量,提高了在线问诊效率。同时人类医生的介入,可以保证机器问诊结果的可靠性,并提升患者就诊满意度。

    一种用于社交媒体中假消息的检测方法

    公开(公告)号:CN112100515A

    公开(公告)日:2020-12-18

    申请号:CN202010921501.9

    申请日:2020-09-04

    Abstract: 本发明提供一种用于社交媒体中假消息的检测方法,所述检测方法采用动态概率图模型。动态概率图模型基于贝叶斯定理,对待检测的帖子具有动态认知,可以随着用户交互数据的源源不断抵达而动态更新,从而对假消息进行过程性检测。为解决数据不均衡抵达问题,动态概率图模型作为一种生成式模型,它可以基于所有真消息的演化特征学习一套演化模式,基于所有假消息学习另一套演化模式,然后对一个待检测的新帖子,判断其更可能符合哪一套模式,以此做出决策,所以模型不会因为训练集的不均衡而出现偏见。

    一种边端融合的终端情境自适应模型分割方法

    公开(公告)号:CN112085758A

    公开(公告)日:2020-12-15

    申请号:CN202010920845.8

    申请日:2020-09-04

    Abstract: 本发明提供一种边端融合的终端情境自适应模型分割方法,以神经网络层为粒度对深度学习模型进行模型分割的过程中,最优分割方式的周围一定存在次优分割方式,并且不受网络带宽变化和网络模型结构变化的影响。在该规律的基础上,当模型运行情境发生变化时,利用预先构建的模型分割状态图中,以当前分割状态为导向,优先在周围近邻分割状态集中搜索,同时加入KD树最近邻搜索算法,可以在最短时间发现最能满足资源约束的分割状态,从而实现模型分割的快速自适应。

    一种基于层次化通信机制的多智能体协作方法

    公开(公告)号:CN116582442A

    公开(公告)日:2023-08-11

    申请号:CN202310285877.9

    申请日:2023-03-22

    Abstract: 本发明公开了一种基于层次化通信机制的多智能体协作方法,首先建立组内通信拓扑结构,根据通信距离将智能体划分为不同组;然后建立组间通信拓扑结构,使用基于邻居节点数量的度中心性方法寻找组中高级别智能体;随后进行组内信息聚合与组间信息交换;使用多头注意力机制搭建层次图卷积网络,对于每个注意头,所有输入特征的值表示都通过关系进行加权并相加;然后,将智能体的m个注意头的输出进行串联,然后将其送入具有ReLU非线性的单层MLP,得到卷积层的输出;最后进行动作决策,根据策略采取行动。本发明通过在智能体之间建立合理高效的层次化通信结构,打破中心化的数据获取、聚合与利用,缓解集中式训练的维度灾难问题。

    一种基于特权知识蒸馏的四足机器人运动规划方法

    公开(公告)号:CN116203945A

    公开(公告)日:2023-06-02

    申请号:CN202211679454.7

    申请日:2022-12-26

    Abstract: 本发明公开了一种基于特权知识蒸馏的四足机器人运动规划方法,首先在PyBullet中构建仿真环境,包括四足机器人动力学建模与复杂地形建模;之后分两阶段分别训练具有特权信息的教师网络与仅利用本体感知的学生网络;对于教师网络,基于PPO算法设计四足机器人的状态更新网络、动作执行网络以及奖励函数等,除了本体感知,还需输入地形信息、接触状态等特权信息,输出足端位置残差,并结合先验步态计算足端目标位置,对机器人进行控制;对于学生网络,使用能够容纳长历史的TCN编码器,通过模仿教师行为监督训练,学生网络能够从历史本体感知中推断出地形信息进行决策。本发明使四足机器人能够在真实环境中仅利用本体感知快速稳定的穿越多种非结构化复杂地形。

Patent Agency Ranking