-
公开(公告)号:CN117541764B
公开(公告)日:2024-04-05
申请号:CN202410029536.X
申请日:2024-01-09
Applicant: 北京大学
Abstract: 本发明提供了一种图像拼接方法、电子设备及存储介质,涉及图像处理领域,所述方法包括如下步骤:获取待拼接视频列表,基于待拼接视频列表和目标神经网络模型,获取待拼接视频对应的第一图像和第二图像,获取第一图像对应的第一特征点列表集和第二图像对应的第二特征点列表集,基于第一特征点列表集和第二特征点列表集进行拼接,获取目标视频,从而完成图像的拼接,提高拼接过程中的准确性和速度。
-
公开(公告)号:CN117544862B
公开(公告)日:2024-03-29
申请号:CN202410029459.8
申请日:2024-01-09
Applicant: 北京大学
IPC: H04N23/951 , H04N5/265 , H04N1/387
Abstract: 本申请涉及一般的图像数据处理或产生技术领域,特别是涉及一种基于图像矩并行处理的图像拼接方法。所述方法包括以下步骤:S100,获取第一图像的初始重叠区域图像P1,0,所述第一图像为第一相机在目标时刻采集得到的图像;S200,获取第二图像的初始重叠区域图像P2,0,所述第二图像为第二相机在目标时刻采集得到的图像;S300,获取P1,0的k‑l阶图像矩m01,kl和P2,0的k‑l图像矩m02,kl;S400,如果|m01,kl‑m02,kl|≤ε0,则将P1,0和P2,0确定为第一图像和第二图像的重叠区域并进行第一图像和第二图像的图像拼接。本发明能够提高图像拼接结果的质量。
-
公开(公告)号:CN116364064B
公开(公告)日:2023-07-28
申请号:CN202310565047.1
申请日:2023-05-19
Applicant: 北京大学
IPC: G10L15/04 , G10L15/16 , G10L15/18 , G10L21/0224 , G10L19/26
Abstract: 本发明提供了一种音频拼接方法、电子设备及存储介质,用于对依序安装在设定位置的Zm个智能设备获取目标对象的音频片段进行拼接,从而获得目标对象的最终音频,所述方法包括如下步骤:获取智能设备采集目标对象音频信息的时间段列表和对应的原始音频片段列表,获取第一重合音频片段和第二重合音频片段,进行噪声检测获取中间音频片段和备用音频片段,对中间音频片段对应的原始音频片段进行语义检测,当语义检测值大于第一预设阈值,将备用音频片段对应的原始音频片段裁剪,并和中间音频片段对应的原始音频片段进行拼接,从而获取最终音频,使得无重合的目标对象的最终音频更加完整,语义更通顺、清晰。
-
公开(公告)号:CN118015634B
公开(公告)日:2024-08-16
申请号:CN202410099035.9
申请日:2024-01-24
Applicant: 北京大学
IPC: G06V30/19 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T3/40 , G06T3/60 , G06V10/44 , G06V10/82 , G06V30/146 , G06V30/166 , G06V30/18
Abstract: 本发明涉及数据处理领域,尤其涉及一种获取手写字符的验证结果的数据处理系统,当计算机程序被处理器执行时,实现以下步骤:根据初始手写字符的第一字符信息获取第一复杂度,若第一复杂度大于复杂度阈值,则首先根据字符识别模型获取到第一验证结果,然后根据第一字符信息获取优先级集合、第一相似度集合以及第二验证结果,最终结合第一验证结果和第二验证结果获取到目标验证结果。可知,初始手写字符的复杂度较高时,通过结合字符识别模型以及初始手写字符和预设手写字符之间的相似性来对初始手写字符进行验证,提高了对手写字符进行验证的准确性。
-
公开(公告)号:CN117544862A
公开(公告)日:2024-02-09
申请号:CN202410029459.8
申请日:2024-01-09
Applicant: 北京大学
IPC: H04N23/951 , H04N5/265 , H04N1/387
Abstract: 本申请涉及一般的图像数据处理或产生技术领域,特别是涉及一种基于图像矩并行处理的图像拼接方法。所述方法包括以下步骤:S100,获取第一图像的初始重叠区域图像P1,0,所述第一图像为第一相机在目标时刻采集得到的图像;S200,获取第二图像的初始重叠区域图像集得到的图像图像矩m02,kl;S400;S300P2,,0如果,,获取所述第二图像为第二相机在目标时刻采|mP011,0,kl的‑mk0‑2l,k阶图像矩l|≤ε0,则将m01,kPl1和,0和P2P,02的,0确定k‑l为第一图像和第二图像的重叠区域并进行第一图像和第二图像的图像拼接。本发明能够提高图像拼接结果的质量。
-
公开(公告)号:CN117541764A
公开(公告)日:2024-02-09
申请号:CN202410029536.X
申请日:2024-01-09
Applicant: 北京大学
Abstract: 本发明提供了一种图像拼接方法、电子设备及存储介质,涉及图像处理领域,所述方法包括如下步骤:获取待拼接视频列表,基于待拼接视频列表和目标神经网络模型,获取待拼接视频对应的第一图像和第二图像,获取第一图像对应的第一特征点列表集和第二图像对应的第二特征点列表集,基于第一特征点列表集和第二特征点列表集进行拼接,获取目标视频,从而完成图像的拼接,提高拼接过程中的准确性和速度。
-
公开(公告)号:CN118015634A
公开(公告)日:2024-05-10
申请号:CN202410099035.9
申请日:2024-01-24
Applicant: 北京大学
IPC: G06V30/19 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T3/40 , G06T3/60 , G06V10/44 , G06V10/82 , G06V30/146 , G06V30/166 , G06V30/18
Abstract: 本发明涉及数据处理领域,尤其涉及一种获取手写字符的验证结果的数据处理系统,当计算机程序被处理器执行时,实现以下步骤:根据初始手写字符的第一字符信息获取第一复杂度,若第一复杂度大于复杂度阈值,则首先根据字符识别模型获取到第一验证结果,然后根据第一字符信息获取优先级集合、第一相似度集合以及第二验证结果,最终结合第一验证结果和第二验证结果获取到目标验证结果。可知,初始手写字符的复杂度较高时,通过结合字符识别模型以及初始手写字符和预设手写字符之间的相似性来对初始手写字符进行验证,提高了对手写字符进行验证的准确性。
-
公开(公告)号:CN116304179B
公开(公告)日:2023-08-11
申请号:CN202310568065.5
申请日:2023-05-19
Applicant: 北京大学
IPC: G06F16/735 , G06F16/78 , G06F16/783 , G06V20/40 , G06V10/74
Abstract: 本发明提供了一种获取目标视频的数据处理系统,包括:若干个视频数据采集端、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取预设时间段内的初始视频数据列表;获取目标对象列表;获取第二视频数据;获取中间图像列表;获取目标视频数据列表。可知本发明能够基于初始视频数据,获取第二视频数据,并根据目标对象的特征向量,对第二视频数据中的每一帧图像进行处理,精准获取到每一帧中目标对象对应的目标图像,将目标对象对应的目标图像组成目标对象对应的目标视频数据,减小了获取目标视频数据的误差,从而有利于提高获取目标视频数据的准确度。
-
公开(公告)号:CN116320612B
公开(公告)日:2023-08-04
申请号:CN202310565044.8
申请日:2023-05-19
Applicant: 北京大学
IPC: H04N21/44 , H04N21/4402 , H04N21/845
Abstract: 本发明提供了一种视频数据传输系统,包括:若干个视频数据采集端、视频数据接收端、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:获取初始视频数据列表;对初始视频数据列表进行预处理,获取到第一中间视频数据列表;根据第一中间视频数据列表,获取预设视频缓存区域ID列表且将第一中间视频数据列表发送至预设视频缓存区域ID列表对应的视频缓存区域内,基于目标丢包率与第一丢包率阈值和第二丢包率阈值进行比较,确定视频缓存区域的存储量,将视频缓存区域的存储量对应的视频数据发送至视频数据接收端;可知,本发明能够通过丢包率的大小对视频数据缓冲区大小进行动态调整,避免数据传输通道的拥堵。
-
公开(公告)号:CN116364064A
公开(公告)日:2023-06-30
申请号:CN202310565047.1
申请日:2023-05-19
Applicant: 北京大学
IPC: G10L15/04 , G10L15/16 , G10L15/18 , G10L21/0224 , G10L19/26
Abstract: 本发明提供了一种音频拼接方法、电子设备及存储介质,用于对依序安装在设定位置的Zm个智能设备获取目标对象的音频片段进行拼接,从而获得目标对象的最终音频,所述方法包括如下步骤:获取智能设备采集目标对象音频信息的时间段列表和对应的原始音频片段列表,获取第一重合音频片段和第二重合音频片段,进行噪声检测获取中间音频片段和备用音频片段,对中间音频片段对应的原始音频片段进行语义检测,当语义检测值大于第一预设阈值,将备用音频片段对应的原始音频片段裁剪,并和中间音频片段对应的原始音频片段进行拼接,从而获取最终音频,使得无重合的目标对象的最终音频更加完整,语义更通顺、清晰。
-
-
-
-
-
-
-
-
-