-
公开(公告)号:CN114972034B
公开(公告)日:2025-05-16
申请号:CN202210633309.9
申请日:2022-06-06
Applicant: 北京工业大学
IPC: G06T3/4046 , G06T9/00
Abstract: 本发明针对基于超先验可变码率图像压缩方法无法针对目标码率快速给出网络应该输入的权衡参数的问题,提出了一种基于超先验可变码率图像压缩的个体R‑λ模型码率控制方法。本方法首先针对基于超先验模型的可变码率压缩框架,通过挖掘测试样本集合的码率与失真优化中的权衡参数λ之间的关系,提出了平均R‑λ模型;然后,假设个体R‑λ模型与平均R‑λ模型共享相同的结构,构建了自适应个体图像分布特性的个体R‑λ模型,并在此基础上建立基于个体R‑λ模型的码率控制算法,该算法通过调整权衡参数λ调节编码比特率,实现码率控制。本发明实现了对于任意图像,给定目标码率下,快速计算出应该输入网络的权衡参数,且码率控制的码率平均相对误差在百分之一到百分之三之间。
-
公开(公告)号:CN119946274A
公开(公告)日:2025-05-06
申请号:CN202510067746.2
申请日:2025-01-16
Applicant: 北京工业大学
IPC: H04N19/157 , H04N19/91
Abstract: 本发明公开了一种基于人眼与机器视觉协同的可拓展的图像编码方法;本发明提出的任务灵活的人眼‑机器协同可拓展图像编码网络,包含编码器,自适应特征划分网络,超编码器,条件上下文模型,超解码器,潜在特征变换网络,解码器以及机器视觉任务下游网络。在可拓展编码网络的损失函数中,增加多阶段学习损失函数。本发明方法实现了最佳的率‑失真性能。
-
公开(公告)号:CN119918677A
公开(公告)日:2025-05-02
申请号:CN202510398928.8
申请日:2025-04-01
Applicant: 北京工业大学
IPC: G06N5/04 , G06N3/045 , G06N5/022 , G06F16/36 , G06F16/353 , G06F40/295 , G06F40/30 , G06Q50/26
Abstract: 本发明公开了基于CoT链式思维的社会治理知识图谱构建的大模型提示设计方法,涉及人工智能领域,具体包括以下步骤:步骤S1、数据预处理;步骤S2、预期输出设计;步骤S3、提示模板生成;步骤S4、知识图谱构建;步骤S5、结果优化与反馈机制。本发明通过引入CoT链式思维,通过任务分解、逐步推理、示范性输出、反馈机制等技术手段,在提示生成过程中引导模型逐步推理,从而确保信息提取的准确性和结构的标准化,最终构建出符合知识图谱要求的数据。CoT链式思维设计的提示有效地帮助大模型理解复杂任务生成高质量输出,并实现了实体标注自动化,输出包含实体类别的五元组数据。
-
公开(公告)号:CN119810568A
公开(公告)日:2025-04-11
申请号:CN202510067728.4
申请日:2025-01-16
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895 , G06N3/0464
Abstract: 本发明公开了基于多域分发复用网络的在线图像增量分类方法,基于多域分发复用网络的在线图像增量分类方法,以RGB图像数据为输入,对数据集进行增量划分;将划分好的图像数据送入多域分发复用图像分类网络,对建立的模型参数进行训练;之后增加新图像数据再次对整个模型进行训练,重复此步骤直至没有新数据可增加;最后对训练好的模型进行测试,输出在线图像增量分类结果。本发明能够有效地弥补传统图像增量分类方法的不足;同时,设计了频域分发复用模块,引入不同高低频组合的混杂因素,以获取不同通道的正交特征聚合信息突出因果相关特征。在每次迭代时隐式地将因果有偏特征转化为无偏特征,从而缓解训练和内存缓冲区数据之间的特征分布偏移。
-
公开(公告)号:CN112818893B
公开(公告)日:2025-01-10
申请号:CN202110184512.8
申请日:2021-02-10
Applicant: 北京工业大学
IPC: G06V20/10 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种面向移动终端的轻量化开集地标识别方法,属于计算机视觉领域。本发明首先基于MobileNet‑V2轻量化网络进行改进,使其适用于地标识别任务,然后利用辅助训练集并构建新损失函数,从而提高网络的外分布异常检测能力,最后使用多项指标评估网络性能。本发明基于轻量化神经网络模型并结合外分布检测方法,使部署在移动端的模型既能排除异常图像干扰,又能高效识别任务内地标建筑,同时具备低延迟和轻量的优势。
-
公开(公告)号:CN113052030B
公开(公告)日:2024-09-24
申请号:CN202110273215.0
申请日:2021-03-11
Applicant: 北京工业大学
IPC: G06V20/64 , G06V10/774 , G06V40/20 , G06T3/4038 , G06F17/16
Abstract: 本发明涉及一种基于单张RGB图像的双流多尺度手部姿态估计方法,用于解决单张RGB图像中自遮挡、近邻关节预测歧义问题。本发明是以RGB图像作为输入,利用深度神经网络提取单张图像的特征并得到手部关节2D姿态初始坐标,利用双分支网络进行2D姿态估计,得到两路手部关节2D姿态坐标;对于两路2D姿态坐标,利用双分支的多尺度语义图U‑Net网络分别估计两路手部关节的3D坐标,然后再将两路3D坐标加和求平均,最终输出手部关节的3D坐标。本发明基于手的不同拓扑结构,更好的利用了关节之间的信息,最终实现高精度的手部姿态估计。
-
公开(公告)号:CN113095328B
公开(公告)日:2024-08-23
申请号:CN202110318561.6
申请日:2021-03-25
Applicant: 北京工业大学
Abstract: 本发明公开了一种基尼指数引导的基于自训练的语义分割方法,本发明提出基尼指数指导的自训练方法,利用基尼指数作为选取更为准确伪标签的指标,引入更多可靠的监督信息,可靠性的伪标签进行自监督训练,基于衡量不确定性和赋予伪标签的方式在训练阶段引入正确的监督信息,减小源域和目标域的差异,提高语义标注精度。
-
公开(公告)号:CN112364190B
公开(公告)日:2024-08-23
申请号:CN202011279655.9
申请日:2020-11-16
Applicant: 北京工业大学
IPC: G06F16/51
Abstract: 公开一种球面图像索引方法及装置,可以像平面图像的二维索引一样直接反映球面三角像元的在球面上的邻域关系,提高访问效率,方便上下采样,能够体现球面三角像元在原始球面上的邻域关系,并且能够像平面图像那样高效地索引三角像元,可以大大开发球面图像的应用难度,潜在应用十分广泛,几乎可以用于所有球面图像处理方法、工具的开发。该方法包括:剖分层次为0的球面三角形T0i投影为平面上的直角三角形,8个最大的球面三角形在某点展开并投影成一个平面上的正方形;该排列的中心点为球面上球面坐标为(0°,0°)的点,四个顶点的球面坐标为(±180°,±90°);令投影后的直角三角形的两个直角边与笛卡尔坐标系重合,则球面三角像元用笛卡尔坐标上的整数坐标直接进行索引。
-
公开(公告)号:CN113723458B
公开(公告)日:2024-08-13
申请号:CN202110861311.7
申请日:2021-07-29
Applicant: 北京工业大学
IPC: G06F18/214 , G06N3/0464 , G06N3/044 , G06N3/048 , G06F16/35
Abstract: 本发明公开了基于层注意Transformer网络的长文档分类方法,步骤一:提取节级别特征;步骤二:节特征之间的交互;步骤三:获取文档的最终表示;步骤四:长文档分类;在验证和测试集方面,提出的HATN网络模型在F1分数下的所有数据集上都优于所有基线,说明的模型能够捕获文档的长时依赖以及实现不同节之间的更高级别的特征交互,从而提高了文档分类的性能。此外,长文档分类模型MLP over SciBERT、LSTM over SciBERT、Longfromer和HATN比传统方法性能更好,这个结果说明得益于注意力和大量的语料库,预训练语言模型对于文档分类的优越性。HATN模型在所有数据集上都得到了一致的改进,证实了该方法的有效性,因为文档的结构信息和层次交互网络带来了改进。
-
公开(公告)号:CN118429203A
公开(公告)日:2024-08-02
申请号:CN202410427460.6
申请日:2024-04-10
Applicant: 北京工业大学
Abstract: 本发明公开了基于不确定性自步学习的事件图像重建方法,属于计算机视觉技术领域;通过对事件点个数进行随机采样,事件帧的重建误差、像素平均值方差和拟合残差进行度量来计算事件帧的不确定性。根据不确定性大小自适应地过滤事件帧,只保留高置信度的事件帧,进而提高事件到图像重建的准确性。在训练过程中,随机采样输入的事件点数,并构建包含不同数量事件点的多组事件帧。这些事件帧共享一个真实的图像,以进行统一的损失计算和模型优化。由于随机采样事件点,导致不同事件帧包含的信息量不同。通过在训练阶段增强模型对事件点变化的鲁棒性,最终得到的重建结果能够保持更好的稳定性和可靠性。
-
-
-
-
-
-
-
-
-