-
公开(公告)号:CN118968255A
公开(公告)日:2024-11-15
申请号:CN202411159169.1
申请日:2024-08-22
Applicant: 南通大学
IPC: G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明实现了一种基于混合扫描Vision Mamba模型的道路垃圾检测方法。包括以下步骤:构建道路垃圾检测数据集;图像标记和数据增强;构建基于混合扫描的改进Vision Mamba模型;训练基于混合扫描的改进Vision Mamba模型;使用训练好的改进Vision Mamba模型检测道路垃圾,并在cifar‑100数据集上进行实验。实验证明改进后的模型有效缓解了Vision Mamba模型空间上下文的有限捕获与不对称的信息处理的问题,其中的Hilbert与分块的patch tokens扫描方式提升了模型对小目标检测的准确度。
-
公开(公告)号:CN118037088A
公开(公告)日:2024-05-14
申请号:CN202311677246.8
申请日:2023-12-08
Applicant: 南通大学
IPC: G06Q10/0639 , G06Q50/26
Abstract: 本发明涉及一种基于多源数据的人居环境质量综合动态评价方法,属于遥感地学应用技术领域。主要步骤包括:1)评价指标体系构建;2)单因子指数选取及计算;3)评价模型构建;4)人居环境质量综合指数计算及其动态评价。本发明提供的方法可以综合动态评价人居环境质量,克服了在人居环境演变研究中数据源、研究尺度及研究内容单一的缺陷,为实现人居自然环境演变、人文环境演变以及两者结合的监测和综合动态评价提供了可能。
-
公开(公告)号:CN119376586A
公开(公告)日:2025-01-28
申请号:CN202411520676.3
申请日:2024-10-29
Applicant: 南通大学
IPC: G06F3/04815 , G06F3/16 , G06F18/24 , G06F16/353 , G06V10/764 , G06F9/54 , G06N5/04 , G06N3/045 , G06F40/205 , G06F40/30 , G06T13/40 , G06F9/451 , G10L15/22 , G10L15/18 , G10L13/02 , G10L15/26
Abstract: 本发明公开了一种采用GPT的多语言3D数字人交互方法,包括:1)创建数字人虚幻引擎;2)解析用户输入的语音、文本、图片、文档的多模态问题内容;3)构建多模态内容审查模型审核上述多模态问题;4)将内容审查正常的用户输入调用GPT流式响应获取问题回答;5)对问题回答(文本)智能分句,得到句子队列;6)对文本队列中的每个句子以异步的方式同时调用TTS节点生成语音,建立语音队列;7)对上一步的语音队列异步执行口型动画生成,得到动画队列;8)按顺序同步播放语音和动画,实时呈现交互效果。相比于现有技术,本发明支持多语言和多模型选择,兼容图片、语音和文档等多种模态输入,并实现了多模态内容审查机制。
-
公开(公告)号:CN118334493A
公开(公告)日:2024-07-12
申请号:CN202410439043.3
申请日:2024-04-12
Applicant: 南通大学
Abstract: 本发明涉及一种SAR影像干涉相干时间序列的洪涝淹没时变动态信息提取方法,属于遥感地学应用技术领域。主要步骤包括:1)合成孔径雷达影像预处理和InSAR相干特征提取,获取InSAR相干时间特征序列;2)基于Quad‑tree平衡采样、决策分割、混合高斯分解的非监督变化信息检测方法,获取动态变化信息的空间位置,并设定为变化靶区;3)围绕变化靶区瓦片,获取瓦片的相干时间序列,利用空域先验信息,采用隐马尔可夫进行时间序列语义分割,提取变化子序列表征的淹没区时变信息,并绘制淹没时变动态图。本发明提供的方法可以快速获取广覆范围的洪涝灾害动态时变信息,且对变化和无变化空间占比多样、失衡问题的具有很好的适应性。
-
-
-