-
公开(公告)号:CN116110407A
公开(公告)日:2023-05-12
申请号:CN202211590817.X
申请日:2022-12-12
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及娇喘音频检测领域,尤其涉及一种基于融合技术的娇喘音频检测方法,包括:利用待检测音频进行初始化处理得到待检测初始化音频;利用所述待检测初始化音频获取待检测初始化音频语谱特征;利用所述待检测初始化音频语谱特征得到娇喘音频检测结果,在娇喘音频中加入对音频种类的判断,通过分类器一过滤掉一部分不属于人声的音频,并把语音种类信息特征融入娇喘音频分类特征中,提高娇喘音频识别的准确率。
-
公开(公告)号:CN115019235A
公开(公告)日:2022-09-06
申请号:CN202210685018.4
申请日:2022-06-15
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06V20/40 , G06V10/762 , G06V10/82
Abstract: 本发明提供一种场景划分和内容检测的方法和系统,通过提取多媒体数据中的多种特征,生成第一向量矩阵,将其输入到状态链模型,得到显性特征分布区域,进而确定出需要的隐性特征分布区域的语义特征集合,将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,实现精确地分段内容检测。
-
公开(公告)号:CN118694752A
公开(公告)日:2024-09-24
申请号:CN202411170581.3
申请日:2024-08-26
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及音视频传输技术领域,尤其涉及一种基于多模态处理的音视频传输系统,包括:端口数据获取模块,其用以获取当前会话环境的各用户端信息;测试模块,用以通过传输测试获取各用户端的可用传输阈值;环境识别模块,其用以获取当前会话环境的维护模态以及确定对各用户端的传输匹配结果;数据流驱动模块,用以确定传输流分配比例、确定各模态数据流的压缩比例以及基于会话环境的维护模态的调整,更新所述压缩比例;本发明通过基于多模态数据的各客户端间的传输速度差异、数据量差异,调整音视频传输压缩方式,能够将同一会话环境中的各用户端的多模态数据的传输数据量通过压缩比例设定进行调整,保证各模态数据的传输同步性。
-
公开(公告)号:CN114187625A
公开(公告)日:2022-03-15
申请号:CN202111370468.6
申请日:2021-11-18
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种基于视频源自动探测技术的视频检测方法,包括:利用待检测视频源链接获取待检测视频源数据;利用所述待检测视频源数据采集待检测视频源图像数据;利用所述待检测视频源图像数据获取待检测视频源检测结果,根据数据值进行判断,防止因奇异值导致分类错误,提升了识别准确率;通过图片预处理,神经网络分类,目标检测等多种方法共同使用,提升了识别率,并在训练时增加负样本,减少了错误率,提升了识别率。
-
公开(公告)号:CN118694752B
公开(公告)日:2024-12-17
申请号:CN202411170581.3
申请日:2024-08-26
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及音视频传输技术领域,尤其涉及一种基于多模态处理的音视频传输系统,包括:端口数据获取模块,其用以获取当前会话环境的各用户端信息;测试模块,用以通过传输测试获取各用户端的可用传输阈值;环境识别模块,其用以获取当前会话环境的维护模态以及确定对各用户端的传输匹配结果;数据流驱动模块,用以确定传输流分配比例、确定各模态数据流的压缩比例以及基于会话环境的维护模态的调整,更新所述压缩比例;本发明通过基于多模态数据的各客户端间的传输速度差异、数据量差异,调整音视频传输压缩方式,能够将同一会话环境中的各用户端的多模态数据的传输数据量通过压缩比例设定进行调整,保证各模态数据的传输同步性。
-
公开(公告)号:CN115019235B
公开(公告)日:2023-06-27
申请号:CN202210685018.4
申请日:2022-06-15
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06V20/40 , G06V10/762 , G06V10/82
Abstract: 本发明提供一种场景划分和内容检测的方法和系统,通过提取多媒体数据中的多种特征,生成第一向量矩阵,将其输入到状态链模型,得到显性特征分布区域,进而确定出需要的隐性特征分布区域的语义特征集合,将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,实现精确地分段内容检测。
-
公开(公告)号:CN116167000A
公开(公告)日:2023-05-26
申请号:CN202211592646.4
申请日:2022-12-13
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06F18/2431 , G06V10/77 , G06V10/44 , G06F40/211 , G06F16/35 , G06F18/25 , G06F18/214 , G06F16/958
Abstract: 本发明提供一种基于AI的互联网内容检测方法和系统,通过识别不同数据包的类型,分别对图像类型或文本类型采用不同的特征提取方式。针对图像类型采用降维采样和滑动窗采样,得到包含高维度局部特征的图像特征。针对文本类型采用断句和聚类,得到重组语句后的序列特征。将图像特征和序列特征按照一定规则融合后,得到特征矩阵,最后采用随机森林的方式得到分类结果。通过上述处理过程,克服了现有单一的卷积神经网络或循环神经网络不足以应付复杂的网络环境的问题。
-
公开(公告)号:CN118841032A
公开(公告)日:2024-10-25
申请号:CN202410752874.6
申请日:2024-06-12
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提供一种多模态音视频数据检测方法和系统,在不损失识别精度的条件下,通过构建一种弱监督的架构来进行音频‑视频多模态融合检测,以此实现面向深度虚假音视频的检测,克服现有检测方法多侧重于单一模态的数据,很难全面检测包含不同模态的数据,以及现有检测方法无法应对将少量虚假信息插入到真实数据中的情形的问题。
-
公开(公告)号:CN115567719B
公开(公告)日:2024-09-24
申请号:CN202211013861.4
申请日:2022-08-23
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: H04N19/42 , H04N19/172 , H04N19/513
Abstract: 本发明提供一种多层次卷积的视频压缩方法和系统,通过当前帧与前后帧的帧间运动矢量对当前帧进行补偿,可以强化当前帧的一些特征向量,由此再进行与参考帧的差值估计、语义分析得到词含义的相似度计算、以及通过转置矩阵计算相关度,剔除非关键帧后,最后进行压缩,可以克服现有技术单帧视频质量增强局限性的问题。
-
公开(公告)号:CN118645096A
公开(公告)日:2024-09-13
申请号:CN202410752872.7
申请日:2024-06-12
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G10L15/22 , G10L15/02 , G10L15/20 , G10L21/0208
Abstract: 本发明提供一种基于多模态的音频检测纠错方法和系统,通过结合声学模型、语义模型以及视觉模型等多种模态信息,对语音识别结果进行自动检测和纠错,克服由于环境噪声、口音差异、语速等因素,现有语音识别结果往往存在误差,无法自动纠错的问题。
-
-
-
-
-
-
-
-
-