-
公开(公告)号:CN119691524A
公开(公告)日:2025-03-25
申请号:CN202411907023.0
申请日:2024-12-24
Applicant: 大连理工大学
Abstract: 本发明属于不平衡数据分类领域,涉及一种基于多层选择双准则评价机制的遗传编程文本数据过采样方法。本方法首先针对现有不平衡数据集进行划分操作,计算出需要生成的样本数量,并得到目标多数类以及目标少数类。然后需要设计遗传编程的演化过程,每个子种群利用设计好的演化过程,独立演化目标样本;适应度函数采用基于距离与角度的双准则评价函数,选择算子采用基于锦标赛选择法改进的适用于双准则评价的选择算法;子种群演化的目标为获得最佳的合成实例。然后从每个演化后的子种群中选择出一个最佳个体作为合成实例,最后将选择的个体与原始数据集组合得到一个完整的平衡数据集。
-
公开(公告)号:CN114359972B
公开(公告)日:2024-12-03
申请号:CN202210046395.3
申请日:2022-01-13
Applicant: 大连理工大学
Abstract: 本发明属于深度学习、目标检测领域,涉及一种基于注意力机制的遮挡行人检测方法。通过本发明构建一个新型的基于注意力机制与遮挡处理的行人检测器SKGNet,将轻量级的选择性核与空间分组增强注意力模块SKG嵌入到ResNet‑101网络的标准残差块中,构建出高效的特征提取骨干网络SKGNet‑101,有助于网络提取到更关键的特征信息,并提高特征图的表达能力。并且针对拥挤场景中的行人遮挡情况,提出了一个掩膜调制模块,以提高遮挡行人的检测性能。通过掩膜模块调制后的特征可以帮助后续的分类网络以更高的置信度检测部分或严重遮挡的行人,否则可能会被忽略而检测失败。
-
公开(公告)号:CN112364757B
公开(公告)日:2022-10-21
申请号:CN202011242807.8
申请日:2020-11-09
Applicant: 大连理工大学
IPC: G06V40/20 , G06V20/40 , G06V10/25 , G06V10/44 , G06V10/80 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明属于计算机视觉领域,涉及视频中的人体动作识别,用于定位和分类视频中人体行为动作,具体为一种基于时空注意力机制的人体动作识别方法。本发明所提供的基于空间变换网络的注意力机制,获取与人体运动相关的区域,从而捕获动作之间的细节变化;本发明所提供的局部区域与全局特征进行融合的方法,加强了人体动作的表示;本发明所提供的全局特征描述符,将来自空间信息、时间信息以及时空交互信息进行聚合来区分人体行为动作,提高识别效果。
-
公开(公告)号:CN111553071B
公开(公告)日:2022-10-14
申请号:CN202010338084.5
申请日:2020-04-26
Applicant: 大连理工大学
IPC: G06F30/20 , G06N3/00 , G06F111/06
Abstract: 本发明属于演化智能计算和多目标优化问题的交叉领域,涉及一种基于随机嵌入辅助模型的高维多目标演化优化方法,可以更加有效地搜寻到全局最优解集。本发明是一种基于随机嵌入辅助系统模型并行运行的双模态演化优化方法,通过这个方法来搜寻全局最优解集。本发明弥补了随机嵌入的随机性所带来的优化搜索缺陷,并利用随机嵌入的高效性,加快了整体的搜索效率。
-
公开(公告)号:CN111739051B
公开(公告)日:2022-10-04
申请号:CN202010490335.1
申请日:2020-06-02
Applicant: 大连理工大学
IPC: G06T7/174
Abstract: 本发明属于计算机视觉与机器学习的交叉领域,一种基于残差网络的多序列MRI图像分割方法,首先将数据集中的MRI多序列作为输入图像的多个通道进行合并处理,并对分割序列进行分离,分离为不同类别的分割图。本发明在经典的编码器解码器分割网络的基础上引入了残差网络,用残差单元代替原来的编码解码网络。利用残差单元内的跳转连接,提取更多的局部特征。增加了同一层级残差单元之间的跳转连接,实现了全局特征的提取。此外,针对MRI图像中目标区域与背景区域在图像中所占比例相差大而导致的分割类别不平衡问题,本发明将交叉熵损失与Dice损失线性结合,并对Dice损失加权来解决该问题。
-
公开(公告)号:CN112348075B
公开(公告)日:2022-09-20
申请号:CN202011206336.5
申请日:2020-11-02
Applicant: 大连理工大学
Abstract: 本发明属于多模态情感计算、深度学习领域,涉及一种基于情景注意力神经网络的多模态情感识别方法。通过本发明方法,针对情感多模态信息进行特征提取和基于注意力机制的特征融合操作,能够有效提取各模态之间的相互作用,然后将得到的特征向量送入神经网络。通过神经网络中嵌入的情景注意力模块来挖掘说话人个人情感依赖特征和全局对话情景特征在空间和通道上的关联性,达到更优的分类效果,更好地针对对话中目标说话人进行情感分析并做出情绪状态判断。
-
公开(公告)号:CN112364757A
公开(公告)日:2021-02-12
申请号:CN202011242807.8
申请日:2020-11-09
Applicant: 大连理工大学
Abstract: 本发明属于计算机视觉领域,涉及视频中的人体动作识别,用于定位和分类视频中人体行为动作,具体为一种基于时空注意力机制的人体动作识别方法。本发明所提供的基于空间变换网络的注意力机制,获取与人体运动相关的区域,从而捕获动作之间的细节变化;本发明所提供的局部区域与全局特征进行融合的方法,加强了人体动作的表示;本发明所提供的全局特征描述符,将来自空间信息、时间信息以及时空交互信息进行聚合来区分人体行为动作,提高识别效果。
-
公开(公告)号:CN119810526A
公开(公告)日:2025-04-11
申请号:CN202411865790.X
申请日:2024-12-18
Applicant: 大连理工大学
IPC: G06V10/764 , G06V10/762 , G06N3/006 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于多层次超像素架构的图像分类模型局部解释优化方法,属于可解释人工智能领域。本发明通过引入模糊聚类算法生成多层次超像素架构,为生成具有多粒度特征的解释提供基础。在此基础上,利用粒子群算法作为高效的优化技术,在多层次超像素架构自上而下地进行选择,每一层生成一个粒子群算法最优解作为当前层次解释。此外,在自上而下的选择过程中,上一层次的最优解指导下一层次的超像素的剪枝,建立不同层次解释之间的联系,最终每一层解释构建形成多层次解释。生成的多层次解释用以解释图像分类模型对输入图像的预测分类标签,帮助人类判断是否相信模型预测。
-
公开(公告)号:CN119808879A
公开(公告)日:2025-04-11
申请号:CN202510004388.0
申请日:2025-01-02
Applicant: 大连理工大学
IPC: G06N3/092 , G06F18/26 , G06F16/9535 , G06F16/9536
Abstract: 本发明公开了一种基于用户满意度的推荐系统优化方法,属于推荐系统技术领域。本发明将用户的决策过程建模为马尔可夫决策过程,并假设用户在与推荐系统交互的过程中始终试图最大化满意度。基于这一假设,用户的交互数据集可视为专家行为数据。随后,本发明提出了一种基于逆强化学习的方法来训练得到用户满意度模型。最后,本发明设计了一项辅助对齐任务使得推荐系统在推荐的过程中最大化用户满意度,该任务可以与任何序列推荐模型相结合,实现推荐系统与用户满意度的对齐。本发明具有通用性强、适用场景广等优点,可广泛应用于新闻、音乐、电商等多种推荐场景。
-
公开(公告)号:CN113095262B
公开(公告)日:2025-01-21
申请号:CN202110429625.X
申请日:2021-04-21
Applicant: 大连理工大学
IPC: G06V20/64 , G06V40/20 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于多任务信息互补的三维体素手势姿态估计方法,步骤为:训练一个参考点精炼网络,获取准确的参考点;训练一个估计网络,使用中已获得的图像的准确参考点和手部关节位置真实值进行监督训练:对估计网络输出的三维热图执行概率估计,确定每个关节点最大的似然相应位置,然后将其转换到真实的坐标系中获得手部关节点的真实3D坐标。本发明使用三维体素化的方式来处理输入与输出,一方面改善了传统方法表示深度图像造成的透视失真,以及回归学习的高度非线性等问题。另一方面则是实现了模型参数压缩,使得模型的收敛更加的迅速,便于训练。同时引入多任务信息互补的策略,这种符合手势物理特性的网络结构在提升估计精度的同时也更具有鲁棒性。
-
-
-
-
-
-
-
-
-