-
公开(公告)号:CN118521876B
公开(公告)日:2024-10-22
申请号:CN202410978491.0
申请日:2024-07-22
Applicant: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/98 , G06N3/045 , G06N3/0464 , G06V10/40 , G06V10/54 , G06V10/74 , G06V10/776 , G06V10/82 , G06V20/40
Abstract: 本发明公开了一种基于相似性度量的沉浸式视频质量评价方法及装置,涉及视频处理领域,为了尽可能地解决视频中所存在的冗余信息问题,首先采用随机抽样的方式筛选视频帧;然后考虑到卷积神经网络能够很好地模拟人类视觉感知过程充分捕捉从低层次到高层次的视觉信息进而提取纹理和结构特征,采用预训练的ResNet50模型进行特征提取;并考虑到人类的视觉感知系统在观看视频时不仅会受视频内容的影响还会受到记忆时间的影响,利用一个受主观启发的时间池化策略得到纹理和深度视频的质量分数;最后根据人眼视觉的偏好对纹理和深度视频质量评分进行权重调整得到最终的沉浸式视频质量分数。本发明具有较好的沉浸式视频质量评价效果。
-
公开(公告)号:CN114239730B
公开(公告)日:2024-08-20
申请号:CN202111564321.0
申请日:2021-12-20
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06F16/901 , G06N5/025 , G06F40/30 , G06V10/44 , G06F16/33 , G06F16/56 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于近邻排序关系的跨模态检索方法,包括:构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型;将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练;结合近邻样本排序损失函数和语义相似度度量损失函数,计算语义对齐的损失值,通过训练缩小损失值,得到训练好的深度神经网络模型;通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达,并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中,实现语义相似度的度量和检索。本发明方法能够有效地实现图像和文本两种不同模态数据间的跨模态检索。
-
公开(公告)号:CN116109880A
公开(公告)日:2023-05-12
申请号:CN202310088624.2
申请日:2023-02-09
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明提供一种鬼影方位视觉注意力学习方法。现有方位视觉注意力学习方法依赖卷积运算进行维度变换以及方位信息学习,计算和参数代价都较高。为此,本发明将轻量的鬼影模块耦合到方位视觉注意力学习方法中,设计降维鬼影模块轻量化压缩特征映射图,随后进行方位信息学习以节约计算和参数代价;设计去冗余鬼影模块降低特征映射图中的冗余信息,能改善特征质量。本发明作为一种新颖的视觉注意力机制有广泛应用,例如图像目标检测、图像目标识别、图像分割等。
-
公开(公告)号:CN109101281B
公开(公告)日:2021-07-02
申请号:CN201810749691.3
申请日:2018-07-10
Applicant: 厦门亿联网络技术股份有限公司
IPC: G06F9/4401 , G06F13/40 , H04L12/24
Abstract: 本发明涉及一种通用的热插拔检测方法,其通过在主设备内核层实现一个热插拔消息缓存驱动,用来在用户层生成可供多用户读写的设备节点,而通过在主设备用户层实现一个热插拔服务程序来监听linux系统的热插拔消息;当热插拔服务程序监听到热插拔消息时,该消息会被写入热插拔消息缓存生成的设备节点中,用户可以通过多个应用读取设备节点,由此获取热插拔事件。因此,本发明有效解决了多用户使用问题和热插拔消息丢失的问题。
-
公开(公告)号:CN110611808B
公开(公告)日:2021-02-05
申请号:CN201910798855.6
申请日:2019-08-27
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明一实施例提供一种相机的解析力测试方法,包括:将相机对ISO12233测试卡拍摄得到的铺满屏幕的图像划分左上、左下、右上、右下和中间5个区域;其中,所述图像包括位于中间区域的楔形线和分别位于所述左上、左下、右上、右下区域的十字楔形线,所述左上、左下、右上和右下4个区域的十字楔形线的图案一致;分别对所述中间区域的楔形线和任一个所述十字楔形线进行定位,获取对应的线束区域;所述线束区域中获取线束的总长度和实际线束长度;根据实际线束长度和线束的总长度之比,计算得到解析力。本发明实施例能够实现各区的楔形线的自动定位、楔形线线束的读取,从而实现相机的解析力测试的自动化。
-
公开(公告)号:CN111343349A
公开(公告)日:2020-06-26
申请号:CN202010115321.1
申请日:2020-02-25
Applicant: 厦门亿联网络技术股份有限公司
IPC: H04M3/56
Abstract: 本发明公开了一种支持多设备会议应用的USB电话装置,包括:触控显示模块、音频处理模块、DECT模块、蓝牙模块、USB接口和MCU控制器;蓝牙模块用于通过蓝牙协议与外置的蓝牙终端进行蓝牙通信连接;USB接口用于与外置的智能终端进行USB通信连接;DECT模块用于通过DECT协议与外置的无线耳机进行通信连接;触控显示模块用于将数据显示在显示屏上并识别获取显示屏上的触控操作指令;音频处理模块用于对接收到的音频数据进行音频处理;MCU控制器用于对接收到的数据进行处理;MCU控制器上还设置有第一混音器,第一混音器用于对MCU控制器接收到的音频数据进行混音处理;MCU控制器分别与触控显示模块、音频处理模块、DECT模块、蓝牙模块和USB接口相连接。
-
公开(公告)号:CN111263106A
公开(公告)日:2020-06-09
申请号:CN202010116187.7
申请日:2020-02-25
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种视频会议的画面追踪方法及装置,该方法先采集视频会议的图像信息和待定位声音信息;对所述视频会议的图像信息进行图像处理,获得与会人员的位置分布数据;对所述待定位声音信息进行声音定位处理,获得声音的位置信息;根据所述声音的位置信息和所述与会人员的位置分布数据,确定与所述待定位声音信息相匹配的人员的位置信息;生成所述人员的位置信息对应的特写图像。本发明技术方案能够提高特写镜头输出特写画面的准确度和提高特写画面的输出速度,从而提高视频会议的沟通效率。
-
公开(公告)号:CN110896457A
公开(公告)日:2020-03-20
申请号:CN201911396330.6
申请日:2019-12-30
Applicant: 厦门亿联网络技术股份有限公司
IPC: H04N7/15
Abstract: 本公开涉及通信技术领域,具体涉及一种视频会议终端及视频会议系统。视频会议终端中设置有内容接收模块(101)、音视频处理模块(102)和显示模块(103),即视频会议终端100本身具备视频会议的功能,可以使视频会议终端既可以作为音频会议终端使用,也可以作为视频会议终端使用,可以丰富视频会议终端的功能。相比于传统的会议终端,本公开实施例提供的视频会议终端部署简单,费用低,且其本身就可以作为视频会议终端使用,利用率高。
-
公开(公告)号:CN114743128B
公开(公告)日:2024-08-09
申请号:CN202210225924.6
申请日:2022-03-09
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06V20/40 , G06V10/30 , G06N3/0464 , G06N3/08 , G06V10/774
Abstract: 本发明公开了一种基于异种神经网络的多模态东北虎再辨识方法及装置,涉及机器视觉技术领域,可应用于跟踪东北虎的活动轨迹调查,对保护濒危的东北虎具有重大意义。本发明的异种神经网络包括用双分支残差神经网络和Transformer网络,其中,双分支残差卷积神经网络用于先对红外图像和可见光图像学习局部特征;Transformer网络对由双分支残差卷积神经网络学得的红外图像和可见光图像的局部特征,利用自注意力机制学习东北虎的全局特征。双分支残差卷积神经网络的各分支结构相同但参数独立,用于处理红外和可见光东北虎图像光谱、分辨率、对比度等特性;而Transformer网络从全局视角学习信息东北虎特征,减少图像模态差异带来的噪声影响,实现高准确率的东北虎再辨识。
-
公开(公告)号:CN113365250B
公开(公告)日:2024-02-23
申请号:CN202110539183.4
申请日:2021-05-18
Applicant: 厦门亿联网络技术股份有限公司
Inventor: 廖昀
IPC: H04W4/70 , H04W4/80 , H04W60/00 , H04W88/06 , H04M1/72412 , H04M1/72415 , H04R1/08 , H04R1/10
Abstract: 本发明提供了一种无线耳麦,包括第一无线收发模块、账号处理模块、会话控制模块、耳麦模块和网络通信处理模块;所述第一无线收发模块用于通过第一无线通信协议实现所述无线耳麦和无线基站之间的数据传输;所述网络通信处理模块用于分别对所述账号处理模块发送的注册指令、所述会话控制模块发送的会话控制数据、所述耳麦模块的媒体数据进行转发或处理。本发明的耳麦无需依赖于外部通讯设备或软件即可实现呼叫功能,从而有效增加了耳麦的使用便捷性,有利于提升用户的使用体验。
-
-
-
-
-
-
-
-
-