Patent search ap:("华南理工大学") AND inv:"殷瑞祥" Page 2

11.

发明公开
一种基于随机深度时延神经网络模型的自动语音识别方法有权

公开(公告)号：CN109065033A

公开(公告)日：2018-12-21

申请号：CN201811091089.1

申请日：2018-09-19

Applicant: 华南理工大学

Inventor： 黄晓荣 , 张伟彬 , 徐向民 , 殷瑞祥

IPC: G10L15/16 , G10L15/14

CPC classification number: G10L15/16 , G10L15/144

Abstract: 本发明属于自动语音识别技术领域，涉及一种基于随机深度时延神经网络模型的自动语音识别方法，包括：准备训练数据；对训练语音音频数据提取声学特征；训练传统GMM‑HMM模型，用训练好的GMM‑HMM模型对训练语音音频数据进行强制对齐，得到对应的帧级别训练标注；利用训练语音音频数据和对应的帧级别训练标注，对基于随机深度的时延神经网络模型进行监督训练，最终结合隐马尔科夫模型得到声学模型；利用对应的文本标注数据或者其他数据集的文本进行训练，得到训练好的语言模型；利用训练好的语言模型和声学模型，构建自动语音识别的解码器。本发明不仅提高了模型的建模能力，还解决了训练过程中过拟合以及梯度消失的问题，从而提高了语音识别的准确性。

12.

发明公开
基于人体生物信息的多级安全保护系统无效

公开(公告)号：CN108109233A

公开(公告)日：2018-06-01

申请号：CN201711341274.7

申请日：2017-12-14

Applicant: 华南理工大学

Inventor： 殷瑞祥 , 金亚强

IPC: G07C9/00 , G06F21/32

Abstract: 本发明公开了一种基于人体生物信息的多级安全保护系统，包括声音拾取模块、非特定说话人的相关文本识别模块、人脸识别模块和特定说话人识别模块，一级安防系统通过声音拾取模块采集非特定说话人对应的文本语音，并由非特定说话人的相关文本识别模块对文本进行识别，如果文本语音识别成功，则打开系统；二级安防系统是在一级安防系统的基础上识别成功后，再由人脸识别模块对特定人脸进行识别，如果识别成功，则打开系统；三级安防系统是在二级安防系统的基础上识别成功后，再由特定说话人识别模块对户主的语音进行识别，如果识别成功，才能够打开系统；所述文本或特定人脸能够由户主添加或者删除，安防系统的等级能够由户主根据需要自行设计。

13.

发明公开
一种基于人脸识别的智能实践教学过程监控方法及系统无效

公开(公告)号：CN107194315A

公开(公告)日：2017-09-22

申请号：CN201710260509.3

申请日：2017-04-20

Applicant: 华南理工大学

Inventor： 吕念玲 , 谢裕麟 , 殷瑞祥 , 王静 , 余翔宇 , 麦乐欣 , 马伟洪

IPC: G06K9/00 , G06Q50/20

CPC classification number: G06K9/00771 , G06K9/00288 , G06K9/00751 , G06Q50/205

Abstract: 本发明公开了一种基于人脸识别的智能实践教学过程监控方法及系统，方法包括课外部分和课内部分；系统包括学生端、教师端、监控设备以及教学平台系统端。本发明将人脸识别技术应用到实践教学过程中，实时监控实践过程，有效避免了实践过程中代做、帮做和抄袭实验结果等舞弊现象，促进了实践教学的智能化和规范化，提升了教学质量，同时使实践成绩评定更加客观化，有效避免了师生冲突，具有极好的应用推广价值。本发明可广泛应用于教学领域中。

14.

发明公开
一种工业设备剩余寿命预测方法、装置、存储介质及设备有权

公开(公告)号：CN111460728A

公开(公告)日：2020-07-28

申请号：CN202010156709.6

申请日：2020-03-09

Applicant: 华南理工大学

Inventor： 张叙文 , 邢晓芬 , 徐向民 , 郭锴凌 , 殷瑞祥

IPC: G06F30/27 , G06N3/04 , G06N3/08 , G06K9/62

Abstract: 本发明提供了一种工业设备剩余寿命预测方法、装置、存储介质及设备；其中方法包括如下步骤：获取工业设备的传感器监测数据，对传感器监测数据进行数据预处理并获取训练样本；注意力循环神经网络的模型构建与训练：使用lstm网络和输出全连接层构建注意力循环神经网络；在训练过程中，通过注意力层和lstm网络对多维传感器时间序列中各类传感器时间序列赋予不同权重，将带不同权重的多维传感器时间序列输入lstm网络获取高维特征，最后通过输出全连接层获取预测结果；通过注意力循环神经网络预测剩余寿命。本发明能够对不同的传感器时间序列赋予不同的权重，使模型更加关注与工业设备剩余寿命相关度高的传感器输入，从而提高预测准确率。

15.

发明公开
一种多人对话系统的情绪识别模型无效

公开(公告)号：CN111460143A

公开(公告)日：2020-07-28

申请号：CN202010164874.6

申请日：2020-03-11

Applicant: 华南理工大学

Inventor： 林小颖 , 徐向民 , 邢晓芬 , 殷瑞祥 , 郭锴凌

IPC: G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种多人对话系统的情绪识别模型，包括S1提取数据集中的特征，所述特征包括文本特征及语音特征；S2根据文本特征及语音特征，构建改进的DialogueRNN网络；S3训练改进的DialogueRNN网络，得到最终的声学模型即情绪识别模型。本发明在考虑模型对现实多人对话场景的建模能力、对上下文信息提取能力及模型的大小等方面的因素下，通过引入Listener的Party State和不同人的Emotion State，提高了DialogueRNN情绪识别模型的性能。

16.

发明公开
基于区域卷积神经网络的第一视角手势识别与交互方法有权

公开(公告)号：CN107168527A

公开(公告)日：2017-09-15

申请号：CN201710273519.0

申请日：2017-04-25

Applicant: 华南理工大学

Inventor： 郑晓旭 , 徐向民 , 殷瑞祥 , 蔡博仑

IPC: G06F3/01 , G06K9/00 , G06N3/08

Abstract: 本发明公开了一种基于区域卷积神经网络的第一视角手势识别与交互方法，该方法包括如下步骤：S1、获取训练数据；S2、设计一个基于区域神经网络，在用于手部检测的同时，也用于手势分类与指尖检测，使得神经网络输入为三通道RGB图像，输出为手势区域的外接矩阵左上角坐标和右下角坐标，以及手势类别、手势骨架关键点；S3，判断手势类别，根据不同交互需求输出相应的交互结果。本发明提供了一种完整的第一视角手势识别与交互方法，通过单模型训练与部分网络共享，提高了第一视角下手势识别的识别速度与准确性。

Patent Agency Ranking