-
公开(公告)号:CN118736575A
公开(公告)日:2024-10-01
申请号:CN202410807697.7
申请日:2024-06-21
Applicant: 中国矿业大学
IPC: G06V20/70 , G06V10/80 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/045 , G06N3/0499 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于增强注意力机制的端到端图像描述生成方法,属于人工智能技术领域。生成图像描述生成模型,包括图像特征抽取层、多粒度特征融合编码器、自适应双向解图码器、线性变换层和打分排序层;对图像描述生成模型使用交叉熵损失进行训练,然后采用自我批评训练优化CIDEr评分优化,并利用完成训练的图像描述生成模型描述图像。其评价指标上超越了现有技术,本发明的图像描述方法不仅提高了图像语义理解能力,而且更贴近人类描述习惯,具有良好的可解释性。
-
公开(公告)号:CN115661535B
公开(公告)日:2023-11-03
申请号:CN202211352018.9
申请日:2022-10-31
Applicant: 中国矿业大学 , 北京开蒙养正科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/28 , G06V10/25 , G06V10/26 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种目标去除背景恢复方法、装置和电子设备,本发明利用深度卷积神经网络的算法,能够有效去除图片中存在的各类目标,并在去除后恢复出该区域背景信息为研究对象,通过分阶段训练得到两个卷积神经网络,基于MaskRcnn实例分割模型的目标去除网络与基于MAE自监督学习模型的背景恢复网络,分阶段式先分割再预测串接构成最终的目标去除背景恢复模型,这种方法能够准确还原图像,恢复效果更好,并且无需专门针对各类场景人工订制训练数据集,具有更好的适用场景可拓展性。
-
公开(公告)号:CN115661535A
公开(公告)日:2023-01-31
申请号:CN202211352018.9
申请日:2022-10-31
Applicant: 中国矿业大学 , 北京开蒙养正科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/28 , G06V10/25 , G06V10/26 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种目标去除背景恢复方法、装置和电子设备,本发明利用深度卷积神经网络的算法,能够有效去除图片中存在的各类目标,并在去除后恢复出该区域背景信息为研究对象,通过分阶段训练得到两个卷积神经网络,基于MaskRcnn实例分割模型的目标去除网络与基于MAE自监督学习模型的背景恢复网络,分阶段式先分割再预测串接构成最终的目标去除背景恢复模型,这种方法能够准确还原图像,恢复效果更好,并且无需专门针对各类场景人工订制训练数据集,具有更好的适用场景可拓展性。
-
公开(公告)号:CN114020862B
公开(公告)日:2024-06-11
申请号:CN202111301692.X
申请日:2021-11-04
Applicant: 中国矿业大学
IPC: G06F16/31 , G06F16/33 , G06F16/332 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06F18/24 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种面向煤矿安全规程的检索式智能问答系统及方法,适用于煤矿数据信息化领域。包括候选文档检索模块、问答对数据生成和管理模块和阅读理解式答案抽取模块,其中候选文档检索模块分别与问答对数据生成和管理模块和阅读理解式答案抽取模块连接,问答对数据生成和管理模块与阅读理解式答案抽取模块连接;其中候选文档检索模块包括文档存储和管理子模块和检索子模块。整个系统简单,使用方便,时间和空间开销低,整体实现用户与系统在字词、语义级别上的信息交互,实现面向煤矿安全规程的用户自然语言问题答案自动生成。
-
公开(公告)号:CN119723077A
公开(公告)日:2025-03-28
申请号:CN202411738371.X
申请日:2024-11-29
Applicant: 中国矿业大学
IPC: G06V10/26 , G06V10/52 , G06V10/80 , G06V10/77 , G06V10/82 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于边缘先验引导的多尺度融合弱监督语义分割模型及方法,属于计算机视觉领域。模型采用权重共享的孪生网络,包括特征提取模块、伪标签生成模块、自对应蒸馏模块和分割模块,在Segformer编码器基础上增加边缘信息提取模块以及边缘信息融合模块,边缘先验与编码器生成的多尺度特征深度融合可以改善伪标签边缘模糊,同时在不引入外部监督的情况下使用自对应蒸馏的方法提炼伪标签。通过计算像素级变化来增强伪标签的局部一致性,提高了伪标签的生成质量,进而提高了对图像的分割精度。本方法所提出的方法所需标注数据更少,标注成本更低。
-
公开(公告)号:CN114020862A
公开(公告)日:2022-02-08
申请号:CN202111301692.X
申请日:2021-11-04
Applicant: 中国矿业大学
IPC: G06F16/31 , G06F16/33 , G06F16/332 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明涉及一种面向煤矿安全规程的检索式智能问答系统及方法,适用于煤矿数据信息化领域。包括候选文档检索模块、问答对数据生成和管理模块和阅读理解式答案抽取模块,其中候选文档检索模块分别与问答对数据生成和管理模块和阅读理解式答案抽取模块连接,问答对数据生成和管理模块与阅读理解式答案抽取模块连接;其中候选文档检索模块包括文档存储和管理子模块和检索子模块。整个系统简单,使用方便,时间和空间开销低,整体实现用户与系统在字词、语义级别上的信息交互,实现面向煤矿安全规程的用户自然语言问题答案自动生成。
-
-
-
-
-