Patent search ap:("厦门大学" OR "睿云联(厦门)网络通讯技术有限公司") AND inv:"兰泽华" Page 1

1.

发明授权
基于视频的毫米波数据自动标注方法及系统有权

公开(公告)号：CN114445914B

公开(公告)日：2025-03-04

申请号：CN202210094081.0

申请日：2022-01-26

Applicant: 厦门大学 , 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄联芬 , 朱晨亮 , 邓培伟 , 林和志 , 陈勇 , 兰泽华 , 林昱 , 陈少伟

IPC: G06V40/20 , G06V20/70 , G06V20/40 , G06V10/82 , G06F18/2131 , G06F18/241 , G06N3/04 , G06N3/096 , G01S13/86

Abstract: 本发明公开了一种基于视频的毫米波数据自动标注方法及系统，其中方法包括：采用多线程同步采集每个时刻待识别区域的毫米波数据和对应视频中的每一帧图像数据；将每一帧图像数据输入到训练好的行为识别神经网络模型进行识别，以得到每个时刻视频中的人体动作识别结果；对毫米波数据进行处理以得到带有时间维度信息的微多普勒特征数据；根据人体动作识别结果对微多普勒特征数据进行划分标注，以得到标注完成的毫米波数据；由此，通过同步采集视频数据和毫米波数据，以便通过视频数据对可解释性较弱的毫米波雷达数据进行标注，从而不仅节省了数据标注成本而且还提高了精确率。

2.

发明公开
基于视频的毫米波数据自动标注方法及系统有权

公开(公告)号：CN114445914A

公开(公告)日：2022-05-06

申请号：CN202210094081.0

申请日：2022-01-26

Applicant: 厦门大学 , 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄联芬 , 朱晨亮 , 邓培伟 , 林和志 , 陈勇 , 兰泽华 , 林昱 , 陈少伟

IPC: G06V40/20 , G06V20/40 , G06K9/00 , G06N3/04 , G06N3/08 , G01S13/86

Abstract: 本发明公开了一种基于视频的毫米波数据自动标注方法及系统，其中方法包括：采用多线程同步采集每个时刻待识别区域的毫米波数据和对应视频中的每一帧图像数据；将每一帧图像数据输入到训练好的行为识别神经网络模型进行识别，以得到每个时刻视频中的人体动作识别结果；对毫米波数据进行处理以得到带有时间维度信息的微多普勒特征数据；根据人体动作识别结果对微多普勒特征数据进行划分标注，以得到标注完成的毫米波数据；由此，通过同步采集视频数据和毫米波数据，以便通过视频数据对可解释性较弱的毫米波雷达数据进行标注，从而不仅节省了数据标注成本而且还提高了精确率。

3.

发明公开
一种基于神经网络的实时回声消除方法有权

公开(公告)号：CN117437929A

公开(公告)日：2024-01-23

申请号：CN202311768706.8

申请日：2023-12-21

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 阮炜玄 , 兰泽华 , 蔡如意

IPC: G10L21/0208 , G10L25/30 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06N3/08

Abstract: 本发明公开了一种基于神经网络的实时回声消除方法，包括：步骤1、构建回声消除模型；步骤2、对所述回声消除模型进行训练；步骤3、构建回声检测模型；步骤4、对所述回声检测模型进行训练；步骤5、将近端音频信号和远端音频信号作为训练后的所述回声消除模型的输入，得到训练后的所述回声消除模型的输出；步骤6、将训练后的所述回声消除模型的输出和远端音频信号作为训练后的所述回声检测模型的输入，得到训练后的所述回声检测模型的输出作为回声检测的标签；步骤7、根据所述回声检测的标签判断当前回声消除模型输出帧的状态，得到最终的目标音频。本发明是结合回声消除模型和回声检测模型，在只采集少量数据的情况下，提高回声消除模型的效果，减小模型的部署难度。

4.

发明授权
基于标签平滑的扩散标签深度学习模型训练方法及介质有权

公开(公告)号：CN116994343B

公开(公告)日：2023-12-15

申请号：CN202311256897.X

申请日：2023-09-27

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄慜哲 , 聂昌伟 , 兰泽华

IPC: G06V40/40 , G06V40/16

Abstract: 本发明公开了一种基于标签平滑的扩散标签深度学习模型训练方法，包括如：步骤1、获取原始训练数据和对应的原始标签；步骤2、将所述原始训练数据和对应的原始标签输入到深度学习模型中；步骤3、对原始训练数据进行混合扩充，得到处理后的混合训练数据；步骤4、根据所述混合训练数据中参与扩充的原始训练数据所对应的原始标签，计算出所述混合训练数据对应的混合标签；步骤5、所述深度学习模型按照扩散的标签平滑方式对原始训练数据、原始标签、混合训练数据和混合标签进行训练，输出预测结果。本发明还提供一种计算机可读存储介质，可以解决泛化性差、过拟合、抗噪能力弱、样本分布和类别不平衡问题。

5.

发明授权
一种基于预训练图片残差的人脸识别活体检测方法有权

公开(公告)号：CN113610042B

公开(公告)日：2023-05-23

申请号：CN202110951138.X

申请日：2021-08-18

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄慜哲 , 兰泽华 , 陈少伟

IPC: G06V40/16 , G06V40/40 , G06V10/82 , G06N3/08

Abstract: 本发明公开一种基于预训练图片残差的人脸识别活体检测方法，具体包括如下步骤：对数据集做平均脸处理；将输入判断的图片与平均脸做残差获得残差图像；将处理后的图像输入神经网络中获取判断结果。本发明通过对比平均脸模型的图片残差，根据神经网络模型判断得出结果，基于常用的神经网络模型ShuffleNet，耗时低，速度快，使用单镜头的准确度与多模镜头的识别率相当。使用对比平均脸模型的图片残差的方式可以显著增强模型泛化性，使用单镜头的方案，适用范围广，成本低，兼容当前主流设备。

6.

发明公开
一种提高遮挡对象识别精度的图像处理方法、装置、系统及计算机可读存储介质审中-实审

公开(公告)号：CN114333026A

公开(公告)日：2022-04-12

申请号：CN202111671592.6

申请日：2021-12-31

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄慜哲 , 钟伟宏 , 兰泽华

IPC: G06V40/16 , G06V10/74 , G06K9/62 , G06T3/00 , G06T3/60

Abstract: 本发明公开了一种提高遮挡对象识别精度的图像处理方法，包括：S1、获取用于注册的第一图像，第一图像包含注册对象及注册对象的关键特征点，且关键特征点所在区域没有遮挡；S2、对第一图像进行特征增强处理，获得关键特征点所在区域在无遮挡状态下的第一增强特征值和模拟遮挡状态下的第二增强特征值并储存于特征数据库的对应位置中。相比现有技术，本发明对对象的注册图片进行数据和增强操作，并在注册图像的基础上模拟遮挡，以获取增强特征，从而提升识别遮挡对象的准确度。

7.

发明公开
一种基于预训练图片残差的人脸识别活体检测方法有权

公开(公告)号：CN113610042A

公开(公告)日：2021-11-05

申请号：CN202110951138.X

申请日：2021-08-18

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 黄慜哲 , 兰泽华 , 陈少伟

IPC: G06K9/00 , G06N3/08

Abstract: 本发明公开一种基于预训练图片残差的人脸识别活体检测方法，具体包括如下步骤：对数据集做平均脸处理；将输入判断的图片与平均脸做残差获得残差图像；将处理后的图像输入神经网络中获取判断结果。本发明通过对比平均脸模型的图片残差，根据神经网络模型判断得出结果，基于常用的神经网络模型ShuffleNet，耗时低，速度快，使用单镜头的准确度与多模镜头的识别率相当。使用对比平均脸模型的图片残差的方式可以显著增强模型泛化性，使用单镜头的方案，适用范围广，成本低，兼容当前主流设备。

8.

发明授权
一种基于神经网络的实时回声消除方法有权

公开(公告)号：CN117437929B

公开(公告)日：2024-03-08

申请号：CN202311768706.8

申请日：2023-12-21

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 阮炜玄 , 兰泽华 , 蔡如意

IPC: G10L21/0208 , G10L25/30 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06N3/08

9.

发明授权
语音数据的处理方法、装置、计算机可读介质及电子设备有权

公开(公告)号：CN111710337B

公开(公告)日：2023-07-07

申请号：CN202010549158.X

申请日：2020-06-16

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 元涛 , 兰泽华 , 林昱

IPC: G10L15/22 , G10L15/26 , G10L15/02 , G10L15/16 , G10L15/06

Abstract: 本申请的实施例提供了一种语音数据的处理方法、装置、计算机可读介质及电子设备。该语音数据的处理方法包括：实时获取语音输入信息；对所述语音输入信息进行分帧处理，得到所述语音输入信息所对应的语音帧；采用预训练的声学模型对所述语音帧进行音素识别，以识别出所述语音帧中包含的音素；针对每次音素识别的结果，对当前识别出的音素进行关键词识别，以确定所述语音输入信息包含的关键词；若连续识别出相同的关键词的次数大于或等于预定数量，则确定所述关键词为目标关键词，以根据所述目标关键词进行相应动作。本申请实施例的技术方案可以提高语音识别的效率，进而保证语音控制设备的响应速度。

10.

发明授权
一种地域性的离线口音语音识别系统的生成方法和装置有权

公开(公告)号：CN112908295B

公开(公告)日：2023-05-16

申请号：CN202110142560.0

申请日：2021-02-02

Applicant: 睿云联(厦门)网络通讯技术有限公司

Inventor： 兰泽华 , 林昱 , 陈少伟

IPC: G10L15/00 , G10L15/16 , G10L17/00 , G10L17/18

Abstract: 一种地域性的离线口音语音识别系统的生成方法，所述方法包括：导入不同地域的语音音频数据；将所述语音音频数据转化为语音识别的语音特征；通过所述语音特征训练包含具有不同地域发音特征的Xvector模型后，提取所述Xvector模型中不同地域的多维度的Xvector特征；利用前置神经网络进一步提取所述语音特征中的第一Xvector特征，并通过所述Xvector模型中Xvector特征所对应的真实标签用于指导所述第一Xvector特征进行第一模型的训练；基于所述第一Xvector特征提取第一语音识别特征进行第二模型的训练后，利用所述第一模型与所述第二模型进行反向更新所述前置神经网络的权重值，得到口音语音识别模型。本方案能够提升离线语音识别系统在同种语音下不同口音的识别性能。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification