-
公开(公告)号:CN118331052A
公开(公告)日:2024-07-12
申请号:CN202410441627.4
申请日:2024-04-12
Applicant: 大连理工大学
IPC: G05B13/04 , G06N3/092 , G06N3/0464 , G06T5/50
Abstract: 本发明属于深度强化学习与机器人控制领域,公开一种基于时序预测模型的视觉机器人控制方法。本发明旨在具有环境背景动态干扰的场景下,实现高维观测图像中任务相关信息的提取,从而提高训练的样本效率和泛化性,以高效完成各种视觉机器人控制任务。包括以下步骤:弱增强视图生成;具有上下文意识的强增强视图生成;通过时序预测网络进行未来状态表征预测;计算辅助任务损失;计算强化学习损失并进行端到端联合训练;在验证环境中进行应用。通过本发明在高维图像输入控制任务场景下,模型可以提取高质量且鲁棒的状态表征,显著地提升视觉机器人训练时的样本效率,同时具有更强的泛化性,适用于未知动态干扰环境下的决策,以高效完成复杂控制任务。
-
公开(公告)号:CN117892209A
公开(公告)日:2024-04-16
申请号:CN202410001797.0
申请日:2024-01-02
Applicant: 大连理工大学
IPC: G06F18/2411 , G06N3/126
Abstract: 本发明提供了一种基于支持向量机和进化计算的过采样方法,属于不平衡数据分类技术领域。本发明使用支持向量机自身的独特能力判别不同的少数类样本对决策边界的影响程度并以此为依据为它们分配合理的权重,从而进一步确定每个少数类样本生成的样本数量,避免了对人的经验的依赖。同时本发明采用了一种全新的方式即进化计算来生成样本,即使用了实数编码遗传算法自动生成新样本并搜索更优的替代方案,同时也强调了间隔对于分类的重要性,增加了对生成样本的评估机制,使用RCGA内置的评估机制以间隔作为衡量标准对生成样本进行评估,避免了传统样本生成方式的盲目性和局限性。
-
公开(公告)号:CN117809740A
公开(公告)日:2024-04-02
申请号:CN202311854339.3
申请日:2023-12-29
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于动态步长的变长染色体进化方法,属于智能优化技术领域。本发明动态地改变了变长染色体进化方法的步长,在前若干代用较大步长探索整个搜索空间,在中后期利用动态步长开发局部的搜索空间,本发明实现了在搜索空间上探索与开发的良好的平衡,有效地增加了算法收敛的速度,并更不容易陷入问题的局部最优值当中,促使深度神经网络对抗攻击问题得到收敛速度更快、表现更好的解决方案。
-
公开(公告)号:CN117709437A
公开(公告)日:2024-03-15
申请号:CN202311729139.5
申请日:2023-12-15
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于融合差分建议的多智能体复杂系统迁移强化学习方法,属于多智能体复杂系统领域。本发明通过引入随机网络蒸馏模型极大地降低了差分建议方法的时间和空间复杂度,同时将差分建议思想扩展到了高维状态空间的复杂环境中,扩大了算法的应用范围。在此基础上设计了一种基于权重的多智能体建议融合方法,更加充分地利用了基于差分建议模型获得的来自多个智能体的建议,使得智能体可以使用来自于多个智能体产生于多个与当前状态略有不同的高维状态上的融合差分建议,提高了知识迁移的质量与效率,显著地提升了多智能体系统前期的学习效果,促使智能体在任务上得到收敛速度更快、表现更好的解决方案。
-
公开(公告)号:CN112347908B
公开(公告)日:2022-10-18
申请号:CN202011219934.6
申请日:2020-11-04
Applicant: 大连理工大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06V10/34 , G06N3/04 , G06N3/08
Abstract: 本发明属于计算机视觉图像分类领域,涉及一种基于空间分组注意力模型的外科手术器械图像识别方法。本方法先针对常见的外科手术采集对应的手术器械图像构建原始数据集,并进行图像增强操作;然后将得到的图像送入神经网络,通过神经网络中嵌入的轻量级空间分组注意力模块来挖掘手术器械图像在特征空间和通道的关联性,对某些特定区域的特征进行增强或抑制,从而达到更好的分类效果,实现对该手术所使用的手术器械的精准分类。
-
公开(公告)号:CN114386582A
公开(公告)日:2022-04-22
申请号:CN202210047220.4
申请日:2022-01-17
Applicant: 大连理工大学
Abstract: 本发明属于人机交互技术领域,涉及人机交互中人体动作的预测,具体为一种基于对抗训练注意力机制的人体动作预测方法。本发明在原始Transformer模型的基础上,对Transformer内部注意力计算机理进行变换优化,设计了一种称为可变形的Transformer模型,用于提取人体运动的时间特征和空间特征,进而捕获长时范围内各个关节点之间的相互依赖关系,从而高效地预测长时范围内的人体动作。其次,本发明引入了对抗训练机制训练所提出的网络模型,将上述生成运动预测的过程作为生成器,并引入连续性判别器和真实性判别器来验证所生成序列的时间平滑性和连续性,以此来缓解首帧不连续问题。
-
公开(公告)号:CN113299084A
公开(公告)日:2021-08-24
申请号:CN202110600132.8
申请日:2021-05-31
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于多视角编码迁移强化学习的区域信号灯协同控制方法,属于机器学习与智能交通的交叉领域。方法包括一种多视角状态编码器以及一种迁移强化学习框架。提出的多视角状态编码器将路口的一维,二维状态以及邻域路口传来的状态信息进行整合编码,将结果作为路口智能体的实际输入。在提出的迁移强化学习框架中,首先独立地训练若干个专注于拟合能力的专家智能体;然后利用迁移来的专家智能体联合指导训练一个专注于泛化能力的种子智能体;最后将种子智能体的参数迁移到各个路口上进行自适应训练,并计算这些智能体与专家智能体的效果差异决定是否进行迭代训练。最终的智能体同时具有更好的决策能力和泛化性能,有效地缓解了交通拥堵。
-
公开(公告)号:CN112348075A
公开(公告)日:2021-02-09
申请号:CN202011206336.5
申请日:2020-11-02
Applicant: 大连理工大学
Abstract: 本发明属于多模态情感计算、深度学习领域,涉及一种基于情景注意力神经网络的多模态情感识别方法。通过本发明方法,针对情感多模态信息进行特征提取和基于注意力机制的特征融合操作,能够有效提取各模态之间的相互作用,然后将得到的特征向量送入神经网络。通过神经网络中嵌入的情景注意力模块来挖掘说话人个人情感依赖特征和全局对话情景特征在空间和通道上的关联性,达到更优的分类效果,更好地针对对话中目标说话人进行情感分析并做出情绪状态判断。
-
公开(公告)号:CN111553475A
公开(公告)日:2020-08-18
申请号:CN202010341693.6
申请日:2020-04-26
Applicant: 大连理工大学
Abstract: 本发明属于演化计算、机器学习的交叉领域,是一种基于随机嵌入技术的高维多模式演化优化方法,可用于多分类支持向量机SVM模型的自动调参。本发明是一种基于多次优化的并行运行而得到的多模式即多个子任务间采用自编码技术来进行子任务间的迁移学习从而提高优化效率的改进的优化算法,可以快速有效地同时优化调节大量的参数,所以非常适用于大规模机器学习模型的超参调节。该方法通过生成多个低维随机嵌入,让每个随机嵌入都可以作为原始的高维任务的替代表示,再利用各个子任务间存在的独特性和相关性,进行一些相互之间的有益迁移学习,一方面有效地提高了对最优解的搜索效率,同时也避免了多次运行的耗时性。
-
公开(公告)号:CN119722845A
公开(公告)日:2025-03-28
申请号:CN202411896551.0
申请日:2024-12-23
Applicant: 大连理工大学
IPC: G06T11/00 , G06N3/126 , G06N3/0455 , G06N3/086 , A63F13/52
Abstract: 本发明属于智能优化技术领域,涉及一种基于多模态大语言模型适应度评估的场景内容生成进化方法。该方法旨在构建一个由LLMs引导的生成内容进化框架,实现对复杂多模态场景中生成内容的灵活、精准评估。本方法通过使用LLMs(如ChatGPT‑4)作为评估机制,辅助进化算法(EAs)(如CMA‑ES、MAP‑Elites)对生成内容的适应度进行全面评估,从而帮助生成模型生成更高质量的图像,这些图像直观地展现了场景的丰富性与多样性,增强了表达的具体性和视觉效果。
-
-
-
-
-
-
-
-
-