-
公开(公告)号:CN117648469A
公开(公告)日:2024-03-05
申请号:CN202311529517.5
申请日:2023-11-16
Applicant: 北京工业大学
IPC: G06F16/9032 , G06F16/903 , G06F16/9038 , G06F40/30 , G06N3/0455 , G06N3/047 , G06N3/0895
Abstract: 本发明公开了一种基于对比学习的交叉双塔结构答案选择方法,属于自然语言处理领域。该方法以学习不同粒度的通用对话表征为目标,将对话表征应用于面向电商平台产品问答的答案选择任务。设计模型采用交叉双塔结构分别处理问答对话中的上下文语句,通过数据增强操作得到语句的不同编码表示,建立正样例,对比学习损失能够间接融合双塔所编码的信息,完成对句子级与对话级特征的建模。此外,加入掩码语言模型训练模式,以融入字符级特征。模型在大型对话语料库上进行训练,精准的对话表征可直接迁移应用于下游的答案排序选择任务,能够缓解面向电商平台的检索类型问答任务所面临的数据稀疏问题。
-
公开(公告)号:CN114170332B
公开(公告)日:2024-12-13
申请号:CN202111426701.8
申请日:2021-11-27
Applicant: 北京工业大学
IPC: G06N3/0495 , G06V10/82 , G06N3/0475 , G06N3/042 , G06N3/0464 , G06N3/096 , G06N3/094 , G06N3/084 , G06V10/764
Abstract: 本发明公开了一种基于对抗蒸馏技术的图像识别模型压缩方法,属于计算机视觉领域。本发明将对抗学习思想引入知识蒸馏中,采用对抗生成网络(GAN)作为框架。将生成器映射为学生模型,真实样本映射为教师模型的知识来进行循环对抗训练。具体包括:采集图像识别数据集并进行类别标注;利用GAN生成图片数据集;选取教师模型并进行训练;采用优化或浓缩小型网络版本选取学生模型;对知识类型进行选取;引入对抗蒸馏算法训练学生模型;实现图像识别任务,解决网络模型参数量大,计算效率低的问题。
-
公开(公告)号:CN119693932A
公开(公告)日:2025-03-25
申请号:CN202411638180.6
申请日:2024-11-16
Applicant: 北京工业大学
IPC: G06V20/64 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于多模态数据融合与3D体素投影的目标检测方法,首先,从RGB图像和深度图像中提取并融合多模态特征;接着,采用特征金字塔网络对多尺度特征进行聚合,并利用真实深度信息将2D特征图精确地映射到3D体素空间中,形成3D体素体积;随后,通过体素特征编码网络提取局部3D特征,并进一步通过3D卷积神经网络提取全局特征。最终,将上述全局特征输入到检测头中,获取最终的目标检测结果。模型在大型公开数据集上进行训练,可以适应特征维度高、结构差异大、分布不均衡的数据,多模态特征的融合能够有效提升3D目标检测的准确度和鲁棒性,适用于物流分拣场景中的物体检测任务。
-
公开(公告)号:CN114170332A
公开(公告)日:2022-03-11
申请号:CN202111426701.8
申请日:2021-11-27
Applicant: 北京工业大学
IPC: G06T9/00 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764
Abstract: 本发明公开了一种基于对抗蒸馏技术的图像识别模型压缩方法,属于计算机视觉领域。本发明将对抗学习思想引入知识蒸馏中,采用对抗生成网络(GAN)作为框架。将生成器映射为学生模型,真实样本映射为教师模型的知识来进行循环对抗训练。具体包括:采集图像识别数据集并进行类别标注;利用GAN生成图片数据集;选取教师模型并进行训练;采用优化或浓缩小型网络版本选取学生模型;对知识类型进行选取;引入对抗蒸馏算法训练学生模型;实现图像识别任务,解决网络模型参数量大,计算效率低的问题。
-
公开(公告)号:CN113486143A
公开(公告)日:2021-10-08
申请号:CN202110569271.9
申请日:2021-05-25
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于多层级文本表示及模型融合的用户画像生成方法,利用真实用户的互联网搜索文本,通过文本预处理,分别从不同层级提取文本特征,经不同的神经网络分类,最后将各神经网络预测出的分类结果经二级分类器进行二次分类,以此实现用户特征画像。将真实用户的互联网搜索数据进行分词,分别生成单词级的向量表示,子词级向量表示和字符级向量表示,分别作为输入传入不同的深度神经网络进行分类,每个神经网络分类器的训练阶段皆使用k折交叉验证的方法,最后将每个一级分类模型得到的训练数据和测试数据的预测结果各自进行拼接,作为二级分类器的训练数据和测试数据进行再次分类,实现对互联网用户的准确画像。
-
-
-
-