Patent search ap:("北京大学深圳研究生院") AND inv:"范梦迪" Page 1

1.

发明公开
使用高斯惩罚检测图像中行人的方法无效

公开(公告)号：CN109101859A

公开(公告)日：2018-12-28

申请号：CN201710474582.0

申请日：2017-06-21

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 董培磊 , 范梦迪 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本发明公布了一种使用高斯惩罚检测图像中行人的方法，在行人检测过程中，使用高斯惩罚对获得的初步行人边界框进行筛选，从而提升对图像中行人尤其是遮挡行人的检测性能；包括：获取行人检测图像的训练数据集、测试数据集和行人标注；使用行人检测方法用训练数据集训练得到检测模型，获取初步的行人边界框及其置信度和坐标；对行人边界框的置信度进行高斯惩罚，得到惩罚后的行人边界框置信度；通过行人边界框筛选得到最终的行人边界框，从而达到去除单个行人的重复边界框，而保留被遮挡行人的边界框的目的，由此实现对图像中行人的检测。本发明能够显著降低行人检测的漏检率，提高遮挡行人的检出率。

2.

发明授权
一种跨媒体检索方法失效

公开(公告)号：CN106202413B

公开(公告)日：2018-11-20

申请号：CN201610544156.5

申请日：2016-07-11

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 韩梁 , 范梦迪 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F17/30

Abstract: 本发明公布了一种新的跨媒体检索方法，利用VGG提出的卷积神经网络VGG net提取图像特征，将VGG卷积神经网络中的第七层全连接层fc7通过ReLU激活函数之后的4096维特征作为图像特征；利用基于Word2vec的Fisher Vector提取文本特征，通过逻辑回归的方法对异构图像、文本特征进行语义匹配，通过基于逻辑回归的语义匹配方法找到图像、文本这两种异构特征之间的关联，从而实现跨媒体检索；本发明的特征提取方法能有效地表示图像和文本的深层语义，可提高跨媒体检索的准确度，从而大幅度提升跨媒体检索效果。

3.

发明授权
一种基于深度语义空间的跨媒体检索方法失效

公开(公告)号：CN108694200B

公开(公告)日：2019-12-20

申请号：CN201710230070.X

申请日：2017-04-10

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 范梦迪 , 董培磊 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F16/40 , G06N3/04 , G06N3/08

Abstract: 本发明公布了一种基于深度语义空间的跨媒体检索方法，包括特征生成阶段和语义空间学习阶段；特征生成阶段通过模拟人对图像的感知过程，生成图像的CNN视觉特征向量和LSTM语言描述向量；利用LDA主题模型挖掘文本的主题信息，进而提取LDA文本主题向量。在语义空间学习阶段，分别利用训练集图像训练得到一个四层的多感知融合的深度神经网络，利用训练集文本训练得到一个三层的文本语义网络。最后将测试图像和文本分别利用两个网络映射到同构的语义空间，从而实现跨媒体检索。与现有方法相比，本发明能够显著提升跨媒体检索性能，具有广阔的应用前景和市场需求。

4.

发明公开
一种跨媒体检索方法失效

公开(公告)号：CN106202413A

公开(公告)日：2016-12-07

申请号：CN201610544156.5

申请日：2016-07-11

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 韩梁 , 范梦迪 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F17/30

CPC classification number: G06F17/30 , G06F17/30265 , G06F17/30247 , G06F17/30684 , G06F17/3069

Abstract: 本发明公布了一种新的跨媒体检索方法，利用VGG提出的卷积神经网络VGG net提取图像特征，将VGG卷积神经网络中的第七层全连接层fc7通过ReLU激活函数之后的4096维特征作为图像特征；利用基于Word2vec的Fisher Vector提取文本特征，通过逻辑回归的方法对异构图像、文本特征进行语义匹配，通过基于逻辑回归的语义匹配方法找到图像、文本这两种异构特征之间的关联，从而实现跨媒体检索；本发明的特征提取方法能有效地表示图像和文本的深层语义，可提高跨媒体检索的准确度，从而大幅度提升跨媒体检索效果。

5.

发明授权
一种跨媒体检索方法失效

公开(公告)号：CN106095893B

公开(公告)日：2018-11-20

申请号：CN201610398342.2

申请日：2016-06-06

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 范梦迪 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F17/30

Abstract: 本发明公布了一种跨媒体数据检索方法，通过基于耦合的特征映射、同种媒体内和不同媒体间的关联挖掘进行跨媒体检索，包括：建立多媒体数据集、对样本集中的所有样本进行耦合特征映射、进行同种媒体类型内的关联挖掘、进行异种媒体类型间的关联挖掘、通过两种关联挖掘方法得到待检索图像或待检索文本的类别概率矩阵进行加权，分别得到图像检索文本的类别相似度矩阵和文本检索图像的类别相似度矩阵、将相似度降序排列进行检索。本发明提供的技术方案整体性能较好、适用性较广，可以用在多种跨媒体检索场景中。

6.

发明公开
一种基于深度语义空间的跨媒体检索方法失效

公开(公告)号：CN108694200A

公开(公告)日：2018-10-23

申请号：CN201710230070.X

申请日：2017-04-10

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 范梦迪 , 董培磊 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F17/30 , G06N3/04 , G06N3/08

Abstract: 本发明公布了一种基于深度语义空间的跨媒体检索方法，包括特征生成阶段和语义空间学习阶段；特征生成阶段通过模拟人对图像的感知过程，生成图像的CNN视觉特征向量和LSTM语言描述向量；利用LDA主题模型挖掘文本的主题信息，进而提取LDA文本主题向量。在语义空间学习阶段，分别利用训练集图像训练得到一个四层的多感知融合的深度神经网络，利用训练集文本训练得到一个三层的文本语义网络。最后将测试图像和文本分别利用两个网络映射到同构的语义空间，从而实现跨媒体检索。与现有方法相比，本发明能够显著提升跨媒体检索性能，具有广阔的应用前景和市场需求。

7.

发明公开
一种跨媒体检索方法失效

公开(公告)号：CN106095893A

公开(公告)日：2016-11-09

申请号：CN201610398342.2

申请日：2016-06-06

Applicant: 北京大学深圳研究生院

Inventor： 王文敏 , 范梦迪 , 王荣刚 , 李革 , 董胜富 , 王振宇 , 李英 , 赵辉 , 高文

IPC: G06F17/30

CPC classification number: G06F17/30 , G06F17/30023

Abstract: 本发明公布了一种跨媒体数据检索方法，通过基于耦合的特征映射、同种媒体内和不同媒体间的关联挖掘进行跨媒体检索，包括：建立多媒体数据集、对样本集中的所有样本进行耦合特征映射、进行同种媒体类型内的关联挖掘、进行异种媒体类型间的关联挖掘、通过两种关联挖掘方法得到待检索图像或待检索文本的类别概率矩阵进行加权，分别得到图像检索文本的类别相似度矩阵和文本检索图像的类别相似度矩阵、将相似度降序排列进行检索。本发明提供的技术方案整体性能较好、适用性较广，可以用在多种跨媒体检索场景中。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification