-
公开(公告)号:CN119835799A
公开(公告)日:2025-04-15
申请号:CN202510110926.4
申请日:2025-01-23
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明提供了一种设备的互联管理方法、装置和电子设备,应用于终端设备,终端设备与第一设备连接,该方法包括:向第一设备发送第一指令,接收第一设备基于第一指令发送的第二设备的设备信息;基于第二设备的设备信息构建实例;其中,实例中的终端设备的子设备包括第一设备,终端设备将第二设备视为第一设备的子设备,即实例中的第一设备的子设备包括第二设备;基于实例向第一设备发送第二指令,以使第一设备基于第二指令与第二设备建立连接;基于实例与第二设备建立连接。该方式中,通过终端设备进行多个设备的互联管理,用户只需要在终端设备进行操作,无需在多个设备上分散操作,操作简单,可以提高互联管理的效率。
-
公开(公告)号:CN119763170A
公开(公告)日:2025-04-04
申请号:CN202411842778.7
申请日:2024-12-13
Applicant: 福州大学 , 厦门亿联网络技术股份有限公司
IPC: G06V40/16 , G06V40/20 , G06V10/24 , G06V10/44 , G06V10/82 , G06T7/11 , G06T7/194 , G06T5/50 , G06T5/60 , G06T5/80
Abstract: 本发明提出一种全自动生成标准证件照的方法,首先对所采集的源图像进行关键点计算,进行辅助向量和对齐中心构建,获取远、近视角的人脸对齐图像;其次,进行头部姿态估计,并采用深度神经网络生成人脸转正图像;最后,将转正图像拼接入远视角对齐图像,进行修复和裁剪,生成标准的证件照;本发明能通过对自拍照的处理来得到符合人脸认证要求标准的证件照,通过自动地调整人脸的角度,并同时实现尺寸裁剪和背景替换功能,生成的证件照符合标准证件照的要求。
-
公开(公告)号:CN119521072A
公开(公告)日:2025-02-25
申请号:CN202411567537.6
申请日:2024-11-05
Applicant: 厦门亿联网络技术股份有限公司
Inventor: 林立峰
IPC: H04R1/20
Abstract: 本申请涉及播放频响均衡技术领域,公开了一种播放频响自适应均衡方法及装置,其方法包括获取扬声器的原始播放信号和麦克风采集的音频信号;利用预设的自适应滤波算法,设计原始播放信号和音频信号之间的房间传递函数;根据房间传递函数,估计频响补偿曲线;基于频响补偿曲线,设计对应的IIR滤波器对原始播放信号进行频响补偿。本申请可以达到提高频响的测量精度,测量方法简单,增强鲁棒性,显著改善扬声器系统频率响应性能的效果。
-
公开(公告)号:CN119495313A
公开(公告)日:2025-02-21
申请号:CN202411675242.0
申请日:2024-11-21
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/0208 , G10L21/0316 , G10L25/21 , G10L25/30
Abstract: 本发明提供了一种语音降噪方法、装置及电子设备,包括:获取原始语音数据;将上述原始语音数据进行预处理,得到预处理音频数据;对上述预处理音频数据进行傅里叶变化,确定上述预处理音频数据对应的幅度谱和相位谱;根据上述幅度谱进行噪声估计,确定幅度谱掩码;基于上述幅度谱掩码、上述幅度谱和上述相位谱,确定上述原始语音数据对应的降噪后的语音数据。该方法通过对语音信号中的幅度谱进行噪声估计,确定幅度谱掩码,以根据幅度谱掩码对原始语音信号进行降噪处理,从而不需要预先了解噪声类型和信噪比。并且,该过程不需要工程师手动优化参数,从而提升语音降噪方法的自动化程度和降噪效果。
-
公开(公告)号:CN118521876B
公开(公告)日:2024-10-22
申请号:CN202410978491.0
申请日:2024-07-22
Applicant: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/98 , G06N3/045 , G06N3/0464 , G06V10/40 , G06V10/54 , G06V10/74 , G06V10/776 , G06V10/82 , G06V20/40
Abstract: 本发明公开了一种基于相似性度量的沉浸式视频质量评价方法及装置,涉及视频处理领域,为了尽可能地解决视频中所存在的冗余信息问题,首先采用随机抽样的方式筛选视频帧;然后考虑到卷积神经网络能够很好地模拟人类视觉感知过程充分捕捉从低层次到高层次的视觉信息进而提取纹理和结构特征,采用预训练的ResNet50模型进行特征提取;并考虑到人类的视觉感知系统在观看视频时不仅会受视频内容的影响还会受到记忆时间的影响,利用一个受主观启发的时间池化策略得到纹理和深度视频的质量分数;最后根据人眼视觉的偏好对纹理和深度视频质量评分进行权重调整得到最终的沉浸式视频质量分数。本发明具有较好的沉浸式视频质量评价效果。
-
公开(公告)号:CN118782070A
公开(公告)日:2024-10-15
申请号:CN202410941579.5
申请日:2024-07-15
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/0232 , G10L21/0216
Abstract: 本申请涉及语音处理技术领域,公开了一种基于幅度谱和复数谱的双阶段语音降噪方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,其方法包括对获取的原始语音信号执行预处理操作,并按预设间隔划分得到若干时帧;确定各不同频率分量的幅度、相位信息和各不同频率分量的复数谱;利用各不同频率分量的幅度进行噪声估计,对原始带噪语音进行初步的噪声抑制,得到初步降噪的幅度谱;基于初步降噪的幅度谱,结合相位信息,转化得到初步降噪的复数谱;利用原始带噪语音的复数谱和初步降噪的复数谱进行噪声估计,转换得到目标语音信号的复数谱。本申请具有在处理低信噪比或者多种类型噪声混合的带噪语音时提升降噪精度的效果。
-
公开(公告)号:CN114239730B
公开(公告)日:2024-08-20
申请号:CN202111564321.0
申请日:2021-12-20
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06F16/901 , G06N5/025 , G06F40/30 , G06V10/44 , G06F16/33 , G06F16/56 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于近邻排序关系的跨模态检索方法,包括:构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型;将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练;结合近邻样本排序损失函数和语义相似度度量损失函数,计算语义对齐的损失值,通过训练缩小损失值,得到训练好的深度神经网络模型;通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达,并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中,实现语义相似度的度量和检索。本发明方法能够有效地实现图像和文本两种不同模态数据间的跨模态检索。
-
公开(公告)号:CN118446920A
公开(公告)日:2024-08-06
申请号:CN202410525371.5
申请日:2024-04-29
Applicant: 厦门亿联网络技术股份有限公司
IPC: G06T5/70 , G06T5/73 , G06T5/60 , G06N3/0464 , G06N3/09 , G06V40/16 , G06V10/44 , G06V10/52 , G06V10/62 , G06V10/80 , G06V10/82 , H04N21/4402 , H04N7/15
Abstract: 本申请涉及一种基于单帧图像的视频会议人脸画质增强方法、装置及计算机设备,其方法包括采集目标人脸图像;对目标人脸图像进行降质处理和噪声扰动,得到第一低质人脸图像和第二低质人脸图像;将第一低质人脸图像和第二低质人脸图像输入预先构建的卷积神经网络模型中,并采用预设的目标损失函数同时进行人脸增强训练,输出第一增强人脸图像和第二增强人脸图像;当卷积神经网络模型收敛时,将此时的卷积神经网络模型作为目标模型,目标模型用于对待增强的单帧人脸图像进行图像增强。本申请具有保证视频前后帧的稳定性,增强模型应对不同噪声时的人脸修复一致性能力的效果。
-
公开(公告)号:CN118262733A
公开(公告)日:2024-06-28
申请号:CN202410359384.X
申请日:2024-03-27
Applicant: 厦门亿联网络技术股份有限公司
Inventor: 邱志豪
IPC: G10L21/0208 , G10L21/0216
Abstract: 本发明涉及盲源分离技术领域,公开了一种基于独立向量分析的阵列麦克风降噪方法及装置。该方法获取阵列麦克风的原始多通道信号;根据原始多通道信号,计算麦克风间相关矩阵;根据原始多通道信号的初始分解矩阵和麦克风间相关矩阵,更新原始多通道信号的加权协方差矩阵,进而更新原始多通道信号的分解矩阵;将原始多通道信号的分解矩阵和原始多通道信号相乘,分离出原始多通道信号中的多个源信号。本发明将盲源分离技术应用于耳机降噪中,可以提高降噪程度和语音保真度;利用提前训练的初始分解矩阵,以及利用VAD语音活动判断控制IVA的更新,可以提高降噪的准确度,并精准控制输出的分离结果为目标声源。
-
公开(公告)号:CN113852508B
公开(公告)日:2024-06-21
申请号:CN202111155599.2
申请日:2021-09-29
Applicant: 厦门亿联网络技术股份有限公司
Inventor: 王世昌
IPC: H04L41/082 , H04L41/08
Abstract: 本发明公开了一种设备批量部署场景下的通信方法及装置,通过建立与服务器之间的通信通道;接收管理系统发送的定时部署策略更新指令,并根据定时部署策略更新指令,更新预设的定时部署策略;根据更新后定时部署策略的部署参数和设备的唯一信息,生成随机数;根据随机数,设置部署事件的触发时间,以使设备到达触发时间时,通过通信通道向服务器发起请求。与现有技术相比,本发明通过采用定时触发策略结合设备随机数的方式,确定具体的设备部署请求时间点,以使达到不同设备不同部署请求时间,保障了相同的部署策略下服务器同一时间点不会有大量的并发请求事件,降低了服务器的压力。
-
-
-
-
-
-
-
-
-