Patent search ap:("西安交通大学") AND inv:"钱学明" Page 4

31.

发明授权
基于GRU单元隐藏状态约束的对话方法、存储介质及系统有权

公开(公告)号：CN112434143B

公开(公告)日：2022-12-09

申请号：CN202011315173.4

申请日：2020-11-20

Applicant: 西安交通大学

Inventor： 赵国帅 , 毛艺钧 , 许文雄 , 钱学明

IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/126 , G06F40/30 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于GRU单元隐藏状态约束的对话方法、存储介质及系统，将带有情感标注的对话数据转换为单轮对话形式的数据构建数据集；建立一个基于多层GRU单元的神经网络模型，利用数据集中的情感信息对神经网络模型的GRU单元隐藏状态进行情感约束，得到情感约束后的隐藏状态；对情感约束后多层GRU单元中的隐藏状态使用上下层继承机制，得到信息融合的GRU单元隐藏状态；使用信息融合的GRU单元隐藏状态生成下一个字的概率分布，然后使用反向传播算法最小化损失值优化神经网络模型的参数，生成带有对应情感的回复信息，实现基于GRU单元隐藏状态约束的对话。本发明根据用户输入生成符合特定情感类别的回复，兼顾了内容上的一致性和情感表达的准确性。

32.

发明授权
一种基于细粒度识别的菜品及属性信息的识别系统及方法有权

公开(公告)号：CN112115966B

公开(公告)日：2022-04-22

申请号：CN202010779870.9

申请日：2020-08-05

Applicant: 西安交通大学

Inventor： 钱学明 , 刘成旭

IPC: G06V10/774 , G06V10/82 , G06V10/764 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明公开一种基于细粒度识别的菜品及属性信息的识别系统及方法，包括：对待识别的菜品图像进行预处理；将预处理后的图像输入训预先练好的深度神经网络菜品分类与属性识别器进行识别，输出菜品的类别属性信息；将获得获得菜品的类别属性信息与预先建立的菜品数据库进行匹配，输出识别结果。本发明拓展了除菜品种类外的相关属性信息，并提高了现有识别的准确率，为实现人们健康膳食推荐、自主烹饪与营养摄入管理等工作提供了更好的系统的服务。

33.

发明授权
一种基于无人机的实时三维重建方法有权

公开(公告)号：CN108428255B

公开(公告)日：2022-04-12

申请号：CN201810138581.3

申请日：2018-02-10

Applicant: 台州智必安科技有限责任公司 , 广东顺德西安交通大学研究院

Inventor： 钱学明 , 徐伟 , 侯兴松 , 邹屹洋

IPC: G06T17/00 , G06T5/00

Abstract: 本发明公开一种基于无人机的实时三维重建方法，包括以下步骤：步骤1，采集场景数据，根据采集的场景数据通过深度传感器得到深度数据，并获取深度图；步骤2，对步骤1得到的深度图进行噪声预处理，噪声预处理包括形态学操作以及滤波操作；步骤3，对步骤2噪声预处理后的深度图进行加速处理，加速处理包括对噪声预处理后的深度图中的二维点进行均匀采样；步骤4，将步骤3加速处理后的深度图转换为点云；步骤5，对步骤4获得的点云进行建模；步骤6，对步骤5获得的结果进行噪声再处理，实现三维重建。本发明能够对场景进行实时三维重建，为无人机的后续智能处理提供可能，有助于推进无人机的应用。

34.

发明公开
一种基于手势识别的无人机智能控制方法无效

公开(公告)号：CN112732083A

公开(公告)日：2021-04-30

申请号：CN202110009676.7

申请日：2021-01-05

Applicant: 西安交通大学

Inventor： 柯良军 , 梁柳 , 钱学明

IPC: G06F3/01 , G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08 , G05B13/04

Abstract: 本发明公开一种基于手势识别的无人机智能控制方法，包括以下步骤：制作行人和人体手势图片样本集及标注行人和手势各种属性学习样本集；构建并训练深度行人和手势检测神经网络，将训练好的网络模型保存；使用行人检测模型对获取的图像并进行做行人检测；对检测到的所有行人进行面积比较，选取面积最大的作为无人机控制者，对控制者位置做区域拓展；使用手势检测模型对选定的区域做手势属性检测；对多帧手势检测结果做时域选择，将最终选择结果发送给无人机。本发明通过对人的手势进行识别分析，并将手势结果作为无人机飞行的指令发送给无人机飞控端，实现人对无人机的灵活控制。

35.

发明授权
基于深度网络与分级测试的电力机车受电弓及电弧检测方法有权

公开(公告)号：CN108288055B

公开(公告)日：2020-09-22

申请号：CN201810210517.1

申请日：2018-03-14

Applicant: 台州智必安科技有限责任公司 , 西安交通大学

Inventor： 钱学明 , 宋天源 , 汪寒雨 , 侯兴松 , 邹屹洋

IPC: G06K9/00 , G06K9/62 , G01R31/12

Abstract: 本发明公开基于深度网络与分级测试的电力机车受电弓及电弧检测方法，包括：采集视频，并提取受电弓图片及其电弧和疑似电弧图片，分类作为神经网络训练样本集；分别建立可在CPU实现实时检测受电弓和检测电弧的卷积神经网络；对卷积神经网络用训练样本进行训练分别得到受电弓检测模型和电弧检测模型和电弧检测模型；利用改进型YOLO算法检测受电弓作为第一级检测，截取受电弓所在区域的局部图片，采用相邻帧预测方法进行提速；在受电弓局部图片内进一步利用改进型YOLO算法检测电弧作为第二级检测，保存异常图片。本发明能利用深度学习的方法快速而准确的检测到受电弓电弧，对潜在的危险进行预警，便于车辆故障检查并保障运行安全。

36.

发明授权
一种以图快速检索景点的方法及导游系统失效

公开(公告)号：CN106776849B

公开(公告)日：2020-01-10

申请号：CN201611066278.4

申请日：2016-11-28

Applicant: 西安交通大学

Inventor： 钱学明 , 周澎

IPC: G06F16/583 , G06F16/54 , G06K9/46 , G06K9/62

Abstract: 本发明公开了一种以图快速检索景点的方法及导游系统，其通过在离线系统中对大规模带有地理标签的图像数据库进行处理，从图像数据集中提取出主题相册，并通过对主题相册内容的进一步去噪，筛选，并添加文字信息最终生成离线景点数据集。并通过生成快速索引结构以提高景点检索的速度。在在线系统中，通过构建查询图与景点数据之间的映射关系以及引入查询图相对于景点的相似度得分算法，并通过最终的打分排序获得检索结果。本发明构建了一个可以通过图像信息快速检索景点的方法，同时通过移动终端对景点信息的多角度展示(景点文字信息，景点相册，景点在地图上的位置标注，以及通过语音合成播报导游词等)为游客提供了完善的自助导游服务。

37.

发明公开
一种基于区域挖掘和空间编码的图像位置估计方法失效

公开(公告)号：CN104778272A

公开(公告)日：2015-07-15

申请号：CN201510202266.9

申请日：2015-04-24

Applicant: 西安交通大学

Inventor： 钱学明 , 赵一斯

IPC: G06F17/30

Abstract: 本发明公开了一种基于区域挖掘和空间编码的图像位置估计方法，由离线部分和在线部分构成，离线部分包括：提取GPS图像库中图像的全局特征，并对图像聚类；对GPS图像库中的每张图像，进行区域挖掘和BOW位置描述符生成；最后，基于视觉单词，为整个GPS图像库建立一个倒排索引表。在线部分包括：通过全局特征提取、匹配得到输入图像的候选图像集；对输入图像进行与离线部分中的区域挖掘和BOW位置描述符生成步骤相同的操作；利用离线部分中的倒排索引表进行基于区域的图像匹配，最终获得输入图像的GPS位置。

38.

发明公开
一种可分级的快速图像GPS位置估计方法失效

公开(公告)号：CN103324677A

公开(公告)日：2013-09-25

申请号：CN201310199867.X

申请日：2013-05-24

Applicant: 西安交通大学

Inventor： 李婧 , 钱学明

IPC: G06F17/30 , G06K9/54

Abstract: 本发明公开了一种可分级的快速图像GPS位置估计方法，其对于离线的数据库，首先按照颜色纹理全局特征对图像进行全局特征聚类，然后，对聚类得到的图像类按照其拍摄的地理位置分到第二级的小中心中，最后对每个聚类中心进行代表性图像选取。在线系统中，首先根据颜色纹理特征选择第一级的候选类，然后在第一级候选类包含的第二级小中心中继续根据颜色纹理特征计算距离并选择第二级候选类，最后通过局部特征确认的方法最终对输入图像进行GPS位置估计。本发明的方法不仅能够有效提高图像的检索速度，而且能够改进检索精度。

39.

发明公开
一种基于多分辨LBP的人脸检索方法失效

公开(公告)号：CN102136062A

公开(公告)日：2011-07-27

申请号：CN201110054986.7

申请日：2011-03-08

Applicant: 西安交通大学

Inventor： 钱学明 , 汪欢

IPC: G06K9/00 , G06K9/62

Abstract: 本发明公开了一种基于多分辨LBP的人脸检索方法，其特征是，包括如下执行步骤：首先对输入的人脸的图像10执行基于多分类器融合的人脸检测单元20；然后执行人脸图像中关键部位的检测单元30；接下来执行人脸图像形状归一化处理单元40；接下来执行关键部位局部区域采样图像单元50；接下来执行多分辨LBP特征描述单元60；接下来执行视觉词汇生成与索引建立单元70；最后执行基于TF-IDF的相似性度量单元80；最终的检索结果在单元90中进行显示。

40.

发明公开
一种获取基于H.264/AVC压缩视频字幕的方法失效

公开(公告)号：CN101527800A

公开(公告)日：2009-09-09

申请号：CN200910021769.0

申请日：2009-03-31

Applicant: 西安交通大学

Inventor： 钱学明 , 刘贵忠 , 李智 , 王喆 , 孙力 , 南楠 , 王琛 , 汪欢

IPC: H04N5/445 , H04N7/26

Abstract: 本发明公开了一种获取基于H.264/AVC压缩视频字幕的方法，包括如下步骤：执行步骤10“H.264/AVC码流解析”，从H.264/AVC压缩视频数据流中解码I帧的亮度分量图像部分解码AC系数；然后执行步骤20“熵解码与反量化”，将步骤10获得的AC系数进行熵解码和反量化以得到每个4×4和8×8块的DCT变换的AC系数；接着执行步骤30“基于块的纹理描述”，对步骤20所获得的AC系数分别对4×4和8×8块进行纹理描述；接着，执行步骤40“字幕块粗检测”，在对I帧中所有块进行纹理描述基础上，初步确认每个块是属于字幕块还是背景块；最后，执行步骤50“字幕条定位”，在字幕块粗检测所得出的模板TMAP获取的基础上进行字幕条的定位：重复步骤10～50，直到视频流结束位置，则执行步骤60“字幕检测结束”。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification