-
公开(公告)号:CN117522762A
公开(公告)日:2024-02-06
申请号:CN202311571346.2
申请日:2023-11-23
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明涉及一种改进的图像拼接方法,属于图像处理技术领域。其中,该方法包括:对待拼接的图像进行视场校正得到校准图像,对校准图像进行特征点配准,得到重合区域。对重合区域进行灰度转换得到灰度直方图,根据灰度直方图对评价图像进行亮度调整,得到均衡图像,对均衡图像进行像素差异均值计算,得到特征相似度图。对特征相似度图进行下采样操作得到下采样特征图,对图片进行数据化处理,对处理后的图片使用最短路径算法得到最短路径。对最短路径中的顶点进行上采样操作得到新图数据的最短路径,根据最短路径得到最优缝合线,根据最优缝合线使用拉普拉斯融合算法将图像进行融合,得到拼接结果图像,提高了图像拼接的效率和精度。
-
公开(公告)号:CN117935817A
公开(公告)日:2024-04-26
申请号:CN202410138708.7
申请日:2024-01-31
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声学警报识别方法及装置,属于音频信号处理技术领域,该声学警报识别方法,包括以下步骤:存储多个音调相同且固定的第一类源信号,并通过理想麦克风采集第一类源信号获得对应的理想麦克风信号,获取第一类源信号和理想麦克风信号之间的理想相关程度;提供待识别的输入信号,获取第一类源信号和输入信号之间的实际相关程度,第一类源信号、理想麦克风信号及输入信号具有相同的采样率;将理想相关程度和实际相关程度进行匹配,根据两者的匹配程度判断输入信号中是否含有第一类源信号。通过直接在时域进行识别,省去了DFT的资源消耗,提供了对于音调相同且固定的警报声的识别方法,只需要用到一个样本音频数据。
-
公开(公告)号:CN110866430A
公开(公告)日:2020-03-06
申请号:CN201810989671.3
申请日:2018-08-28
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种车牌识别方法及装置,所述方法包括:步骤S1,利用基于图像特征的局部车牌图像训练AdaBoost级联车牌分类器,利用车牌分类器对视频序列图片进行滑窗检测,得到视频序列图片中的车牌粗选区域;步骤S2,利用多尺度框融合方法,对得到的检测框进行合并,剔除低置信度度检测框;步骤S3,于得到融合后检测框后,在原始输入图像上切割出车牌区域图像,进行车牌精确定位;步骤S4,基于边缘检测算子对完成上下边界精确定位的图像提取字符边缘信息,得到完整车牌;步骤S5,根据二值化算法和连通域分析对精确定位的完整车牌进行字符切割;步骤S6,通过卷积神经网络识别切割字符,得到检测结果。
-
公开(公告)号:CN118155645A
公开(公告)日:2024-06-07
申请号:CN202410283399.2
申请日:2024-03-13
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0216 , G10L21/034 , G10L25/18 , G10L25/30
Abstract: 本发明涉及音频信号处理技术领域,尤其涉及一种神经网络定向拾音方法、系统及可读存储介质,方法包括以下步骤:将麦克风阵置于坐标系中,规定增强方向,麦克风阵列至少包括一个麦克风对;对每个麦克风对在增强方向上接收的目标声源信号进行增强处理,得到目标声源增强信号及目标声源阻塞信号;将目标声源增强信号及目标声源阻塞信号转换成特征向量;将特征向量输入训练好的深度神经网络模型中,输出的增益作用于目标声源信号,得到增强信号。相比于传统的定向增强算法,本发明在拾取增强方向中混杂着非增强方向的声音时,在资源消耗提升不大的情形下能够对增强方向的声音进行更好的保留同时对非增强方向的声音进行更好的抑制。
-
公开(公告)号:CN117768787A
公开(公告)日:2024-03-26
申请号:CN202311613339.4
申请日:2023-11-29
Applicant: 上海富瀚微电子股份有限公司
IPC: H04N23/70
Abstract: 本发明提供一种曝光控制方法、曝光控制装置及存储介质,包括:提供一参考亮度值,并进入曝光控制循环步骤;曝光控制循环步骤包括:获取当前帧图像的统计亮度值;判断所述参考亮度值和所述统计亮度值的差值的绝对值是否大于一预设阈值;若否,则判定当前处于曝光稳定状态,结束所述曝光控制循环步骤;若是,则判定当前处于曝光不稳定状态,并根据所述参考亮度值、所述当前帧图像的所述统计亮度值,生成一预测亮度值;根据所述预测亮度值,生成新的曝光参数;根据所述新的曝光参数,获取所述当前帧图像的下一帧图像;以所述当前帧图像的下一帧图像作为新的所述当前帧图像。本发明能够实现无光敏传感器的自动曝光控制。
-
公开(公告)号:CN117560572A
公开(公告)日:2024-02-13
申请号:CN202311510792.2
申请日:2023-11-14
Applicant: 上海富瀚微电子股份有限公司
IPC: H04N23/68
Abstract: 本发明涉及一种评估视频抖动的方法及系统,属于视频图像处理技术领域。其中,该方法包括:对标定靶光源进行抖动录制,得到RGB格式的光源视频数据;对光源视频数据进行灰度转化和光心位置检测得到光心坐标。根据光心坐标计算灰度视频数据的相邻帧的光心坐标差值,根据光心坐标差值进行标准差计算得到横向标准差和纵向标准差。将横向标准差和纵向标准差输入抖动抑制率公式,得到横向抖动抑制率和纵向抖动抑制率和抖动抑制率评估分析结果。将对视频抖动抑制效果的评价量化为对抖动抑制率的计算,获得具有客观性和鲁棒性的防抖性能评价指标,可以适用于不同的防抖设备和复杂的光照环境。
-
公开(公告)号:CN117495697A
公开(公告)日:2024-02-02
申请号:CN202311591598.1
申请日:2023-11-27
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明提供一种图像融合方法、图像融合装置、电子设备及存储介质,包括:包括以下步骤:获取第一图像信息和第二图像信息,所述第一图像信息与所述第二图像信息来源于不同传感器在同一时间段内对同一拍摄目标的多个拍摄图像中的同一帧;根据所述第一图像信息和所述第二图像信息,获取所述第一图像信息的第一融合权重和所述第二图像信息的第二融合权重;根据所述第一融合权重和所述第二融合权重,获取时空域加权数;根据所述时空域加权数,对所述第一图像信息和所述第二图像信息进行时空域滤波;以所述时空域滤波的输出结果作为图像融合计算的计算依据。本发明充分利用两路图像信号的特点,使图像信号有效融合,提升图像质量。
-
公开(公告)号:CN116863951A
公开(公告)日:2023-10-10
申请号:CN202311055231.8
申请日:2023-08-21
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声源定位及语音增强方法、装置,属于音频信号处理技术领域,该声源定位方法,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。通过设置相应的增益因子和补偿因子作用在求和结果和差分结果上,从而分别解决低频指向性差和环境噪声的问题,且可以灵活选择麦克风对的组合,提升定位效果和语音增强效果。
-
公开(公告)号:CN108737747B
公开(公告)日:2021-06-11
申请号:CN201710253890.0
申请日:2017-04-18
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种去马赛克方法及装置,该方法包括:获取RGBIR/RGBW格式的数据;将RGBIR/RGBW格式的数据内插得到亮度全分辨率的数据;根据RGBIR/RGBW格式的数据与得到的内插后的亮度全分辨率数据获得色度U信息;根据RGBIR/RGBW格式的数据与得到的内插后的亮度全分辨率数据获得色度V信息;根据获得的亮度信息以及色度信息输出YUV全幅面图像,通过本发明,能够自动且高效地进行去马赛克。
-
公开(公告)号:CN108737747A
公开(公告)日:2018-11-02
申请号:CN201710253890.0
申请日:2017-04-18
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种去马赛克方法及装置,该方法包括:获取RGBIR/RGBW格式的数据;将RGBIR/RGBW格式的数据内插得到亮度全分辨率的数据;根据RGBIR/RGBW格式的数据与得到的内插后的亮度全分辨率数据获得色度U信息;根据RGBIR/RGBW格式的数据与得到的内插后的亮度全分辨率数据获得色度V信息;根据获得的亮度信息以及色度信息输出YUV全幅面图像,通过本发明,能够自动且高效地进行去马赛克。
-
-
-
-
-
-
-
-
-