-
公开(公告)号:CN113723458A
公开(公告)日:2021-11-30
申请号:CN202110861311.7
申请日:2021-07-29
Applicant: 北京工业大学
Abstract: 本发明公开了基于层注意Transformer网络的长文档分类方法,步骤一:提取节级别特征;步骤二:节特征之间的交互;步骤三:获取文档的最终表示;步骤四:长文档分类;在验证和测试集方面,提出的HATN网络模型在F1分数下的所有数据集上都优于所有基线,说明的模型能够捕获文档的长时依赖以及实现不同节之间的更高级别的特征交互,从而提高了文档分类的性能。此外,长文档分类模型MLP over SciBERT、LSTM over SciBERT、Longfromer和HATN比传统方法性能更好,这个结果说明得益于注意力和大量的语料库,预训练语言模型对于文档分类的优越性。HATN模型在所有数据集上都得到了一致的改进,证实了该方法的有效性,因为文档的结构信息和层次交互网络带来了改进。
-
公开(公告)号:CN113723106A
公开(公告)日:2021-11-30
申请号:CN202110861340.3
申请日:2021-07-29
Applicant: 北京工业大学
IPC: G06F40/30 , G06F40/284 , G06F40/211 , G06K9/62 , G06F16/35
Abstract: 本发明公开了基于标签扩展的零样本文本分类方法,该方法包括以下两个步骤:步骤一:扩展标签;对数据集的假设标签信息通过专家知识,大型的知识库以及与预训练的语言模型扩充丰富其语义知识。步骤二:零样本文本分类;BERT是基于注意力的双向语言模型,将标识作为输入,BERT通过多层的Transformer编码器获取标识嵌入。将BERT在大型的文本蕴含数据集上进行预训练。对BERT模型进行微调和预训练完成之后,对可见类别的实例S进行训练。照BERT的输入标识规则输入BERT中,BERT提取两句话的特征,最后将特征通过线性层输出两句话蕴含和矛盾的概率。训练完成之后,任意输入测试集的两句话进行蕴含测试。使得标签和文本之间蕴含更多的语义信息来提高泛化的零样本文本分类性能。
-
公开(公告)号:CN113468471A
公开(公告)日:2021-10-01
申请号:CN202110543478.9
申请日:2021-05-19
Applicant: 北京工业大学
Abstract: 本发明提出一种基于张量型加权Schatten‑p范数的交通数据修复方法。该方法首次将加权Schatten‑p范数引入交通数据修复的问题中,其形式更接近于张量秩函数的形式,更确切地说是加权核范数和张量秩函数之间的一种平衡,可以更好地挖掘数据之间的各向异性;其次,提出一种全新的权重向量构造方法,可以极大限度地保证奇异值之间的大小关系,保证数据的主成分不被破坏;最后,通过引入广义奇异值软阈值算法和ADMM算法,成功求解优化问题的全局最优解。本发明进一步优化低秩结构,确保结果的低秩性以及对权重向量进行重构,保证各个奇异值在原数据中所起的作用,最终提升数据修复效果。
-
公开(公告)号:CN113409327A
公开(公告)日:2021-09-17
申请号:CN202110608265.X
申请日:2021-06-01
Applicant: 北京工业大学
Abstract: 本发明提出一种基于排序与语义一致性约束的实例分割改进方法,针对如何提高分割实例的掩膜质量问题,主要是提出面向实例分割网络的排序损失与语义一致性损失,前者优化子区域的选择结果,后者优化子区域的语义分割结果。实例分割属于计算机视觉领域的重要任务,既要求区分具体实例,又要求完成分类与定位任务。当前的实例分割方法,存在分割实例的掩膜质量不高的问题,这对很多实际任务有不可忽略的负面影响。提出的排序损失与语义一致性损失,可以应用于目前已有的任意两阶段与单阶段实例分割框架中。在公开数据集上进行的实验表明,增加排序损失与语义一致性损失后,深度网络的实例分割效果均取得一定程度的提升,分割实例的掩膜质量有所改善。
-
公开(公告)号:CN113326974A
公开(公告)日:2021-08-31
申请号:CN202110492567.5
申请日:2021-05-01
Applicant: 北京工业大学
Abstract: 本发明提出了一种基于多任务超图卷积网络的多源交通客流预测方法,涉及深度学习等领域,尤其是面向超图表示以及图卷积网络的流量预测任务。本方法适用于时空对齐的多源异构交通流数据,多源异构交通流数据相互影响该方法包含一个主要任务和一个相关任务。两项任务均基于超图卷积神经网络,并由通过一个特征压缩单元连接,该特征压缩单元对任务之间的相关性进行建模并共享潜在特征,以增强主要任务的性能。相较于单一数据驱动模型,该方法可适用于多源异构交通数据。完成了轨道交通客流预测的任务,提高了预测准确率。
-
公开(公告)号:CN109743570B
公开(公告)日:2021-07-06
申请号:CN201910022363.8
申请日:2019-01-09
Applicant: 北京工业大学
IPC: H04N19/122 , H04N19/176 , H04N19/51
Abstract: 本发明涉及一种屏幕内容视频的压缩方法,属于图像处理的技术领域,主要在现有的HEVC编码器上进行改进,解决了其基于哈希的帧间预测未能为当前编码块匹配相似图像块作为参考块以及编码过程中对图像块哈希值重复计算的问题。包括计算当前编码帧中所有图像块的哈希值;为当前帧生成哈希图;依据哈希图生成当前编码帧的哈希表;接下来对当前编码帧中的所有编码块执行以下步骤:从哈希图获取当前编码块的哈希值;在参考块中匹配到当前编码块的参考块;由HEVC完成当前编码块的编码。改进后的编码器在LD配置文件下的编码时间为原编码器的104%,平均BD码率增益为1.5%,在LD配置文件下的编码时间为原编码器的101%,平均BD码率增益为0.94%。
-
公开(公告)号:CN113052030A
公开(公告)日:2021-06-29
申请号:CN202110273215.0
申请日:2021-03-11
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于单张RGB图像的双流多尺度手部姿态估计方法,用于解决单张RGB图像中自遮挡、近邻关节预测歧义问题。本发明是以RGB图像作为输入,利用深度神经网络提取单张图像的特征并得到手部关节2D姿态初始坐标,利用双分支网络进行2D姿态估计,得到两路手部关节2D姿态坐标;对于两路2D姿态坐标,利用双分支的多尺度语义图U‑Net网络分别估计两路手部关节的3D坐标,然后再将两路3D坐标加和求平均,最终输出手部关节的3D坐标。本发明基于手的不同拓扑结构,更好的利用了关节之间的信息,最终实现高精度的手部姿态估计。
-
公开(公告)号:CN112950475A
公开(公告)日:2021-06-11
申请号:CN202110254556.3
申请日:2021-03-05
Applicant: 北京工业大学
Abstract: 一种基于残差学习及空间变换网络的光场超分辨率重建方法属于计算机视觉领域。本发明根据光场图像空间分辨率低的问题对图像进行超分辨率重建,首先设计了4+1的融合模型来学习光场图像的特征,此外,为了更好的提取特征,本发明将空间变换网络的定位器进行了改进。在具体操作中,将图像按照相对位置分别输入到改进的空间变换网络中,通过递归结构的卷积神经网络进行特征重建与融合,期间充分利用了相邻视图的特征信息,弥补了其他方法对相邻视点信息利用的不足,配合先进的网络结构设计,使得模型具有更好的重建效果。
-
公开(公告)号:CN112818889A
公开(公告)日:2021-05-18
申请号:CN202110182159.X
申请日:2021-02-09
Applicant: 北京工业大学
Abstract: 本发明公开了基于动态注意力的超网络融合视觉问答答案准确性的方法,先提取图像中两两物体之间的关系特征。通过进行关系特征的向量表示和问题文本的向量表示的余弦相似度的操作来动态的选取和问题文本相关的关系特征,并将余弦相似度分数排在前三的关系特征被选取为最为相关的关系特征;为了使视觉图片和问题文本中提取的特征融合的更加充分,提用基于超网络的卷积融合方式。利用融合图像‑问题特征学习多分类的分类器,以正确预测最佳匹配答案。使特征融合更加充分,能够使两模态之间进行深层次的交互,进一步促进视觉问答技术的准确性能的提升。
-
公开(公告)号:CN108154194B
公开(公告)日:2021-04-30
申请号:CN201810049756.3
申请日:2018-01-18
Applicant: 北京工业大学
Abstract: 本发明涉及一种用基于张量的卷积网络提取高维特征的方法,可应用于多维信号的分类识别场景中。模型核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件主要由多个可分离卷积层组成,特征融合组件主要由一个多维卷积核组成。那么,整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成,最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。
-
-
-
-
-
-
-
-
-