-
公开(公告)号:CN118015282A
公开(公告)日:2024-05-10
申请号:CN202410311121.1
申请日:2024-03-19
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/26 , G06V20/70 , G06T7/194 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/048
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于背景先验的弱监督语义分割方法,包括:将仅带有图像级标签的特定数据集输入背景聚类算法中根据像素值进行背景聚类,得到聚类掩码图;将数据集输入到在自然图像上经过预训练的SAM模型中进行推理,得到预训练掩码图;通过分割结果融合模块将聚类掩码图和预训练掩码图进行基于IOU的掩码融合,生成背景掩码图;利用多个串行的多尺度拼接卷积块,实现数据集特征的塔式提取,生成分类特征图;将背景掩码图对分类特征图中的前景和背景进行区分;将前景输入到分类器进行分类操作,并进行视觉可视化;本发明解决了现有的语义分割技术中分割标签难以获得和弱监督分割效果不佳的问题。
-
公开(公告)号:CN118015282B
公开(公告)日:2024-11-05
申请号:CN202410311121.1
申请日:2024-03-19
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/26 , G06V20/70 , G06T7/194 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/048
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于背景先验的弱监督语义分割方法,包括:将仅带有图像级标签的特定数据集输入背景聚类算法中根据像素值进行背景聚类,得到聚类掩码图;将数据集输入到在自然图像上经过预训练的SAM模型中进行推理,得到预训练掩码图;通过分割结果融合模块将聚类掩码图和预训练掩码图进行基于IOU的掩码融合,生成背景掩码图;利用多个串行的多尺度拼接卷积块,实现数据集特征的塔式提取,生成分类特征图;将背景掩码图对分类特征图中的前景和背景进行区分;将前景输入到分类器进行分类操作,并进行视觉可视化;本发明解决了现有的语义分割技术中分割标签难以获得和弱监督分割效果不佳的问题。
-
公开(公告)号:CN119963332A
公开(公告)日:2025-05-09
申请号:CN202510052036.2
申请日:2025-01-14
Applicant: 南京龙垣信息科技有限公司
IPC: G06Q40/04 , G06Q20/38 , G06Q30/0201 , G06Q30/015 , G06F18/23213
Abstract: 本发明涉及金融风险管理技术领域,具体涉及一种基于生成式大模型的风险资金预测方法及系统,实时收集金融交易数据;对收集到的数据进行预处理,并采用深度特征聚类技术,将相似的交易行为聚集在一起;采用Qwen‑2模型作为核心,针对交易数据调整生成式大模型参数,实现风险交易大模型的构建、用户交易画像的生成、风险交易预测与预警,以及模型反馈机制;将生成式大模型的输出与实时交易数据结合,快速识别潜在的异常交易,并输出风险评分;结合自然语言处理技术,实现语音生成与用户的智能客服交互,实时反馈风险评估结果并提供相应建议。解决了现有技术在风险资金预测中存在不足的问题。
-
公开(公告)号:CN118280389A
公开(公告)日:2024-07-02
申请号:CN202410365711.2
申请日:2024-03-28
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及语音识别技术领域,具体涉及一种多重对抗判别伪造音频检测系统;包括数据采集模块、波形检测模型、时域特征建模模块和对抗神经网络分类器;波形检测模型用于提取预处理后的原始音频数据中的频谱,基于频谱的连续性判别原始音频是否为真实音频;时域特征建模模块用于对音频波形与特征进行建模;对抗神经网络分类器用于对特征进行判别,再次判别原始音频是否为真实音频;通过对目标音频进行波形频谱分析,采用深度神经网络对于音频波形与特征进行建模,使用对抗神经网络对特征进行判别,从而判断音频来源是否伪造,获得检测出深度音频的伪造,提高检测的准确性和鲁棒性的效果。
-
公开(公告)号:CN118038886A
公开(公告)日:2024-05-14
申请号:CN202410179297.6
申请日:2024-02-18
Applicant: 南京龙垣信息科技有限公司
IPC: G10L21/0272 , G10L17/14 , G10L15/26 , G10L21/0216 , H04L12/18
Abstract: 本发明涉及会议记录技术领域,具体涉及一种异构多说话人自适应语音会议记录系统及方法;包括多通道语音采集模块、语音分离模块、语音识别模块、会议记录模块、说话人识别模块和说话人标注模块;多通道语音采集模块用于获取不同方位的语音;语音分离模块用于将多个说话人混合的语音信号分离为独立的单说话人语音;语音识别模块用于根据输出语音进行识别并输出;说话人识别模块用于根据输出语音确定说话人;说话人标注模块用于对说话人的身份进行标注;会议记录模块用于记录文本数据及说话人身份的标注数据;通过上述方式,实现了分离语音与对应说话人的匹配,对分离并标注说话人的语音信号进行转录,生成多说话人的会议记录。
-
公开(公告)号:CN120048010A
公开(公告)日:2025-05-27
申请号:CN202510113075.9
申请日:2025-01-24
Applicant: 南京龙垣信息科技有限公司
IPC: G06V40/70 , G06V40/16 , G06V40/20 , G10L17/00 , G10L25/24 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/0464
Abstract: 本发明涉及身份识别技术领域,具体涉及一种基于深度学习的多模态数据融合身份认证与安全监控系统;包括身份认证模块、实时分析模块和远程控制模块,身份认证模块用于,收集用户的面部图像、声音以及行为模式多模态数据,并进行多模态数据融合,输出用户的身份认证数据;实时分析模块用于,分别收集实时的视频数据及音频数据,并融合画面检测数据和声音检测数据,输出实时异常行为数据;远程控制模块用于,存储身份认证数据和实时异常行为数据,并采用远程访问的方式传输数据;通过上述方式,实现提高在分析时提高识别精度,减少受环境因素的干扰,从而提高整体身份认证系统的安全性和用户体验。
-
公开(公告)号:CN119479656A
公开(公告)日:2025-02-18
申请号:CN202411649065.9
申请日:2024-11-19
Applicant: 南京龙垣信息科技有限公司
IPC: G10L17/02 , G10L21/0208 , G10L25/24 , G10L17/18 , H04L9/40
Abstract: 本发明涉及声纹识别技术领域,尤其涉及一种匿名说话人身份验证溯源系统,包括音频输入模块、预处理模块、伪造音频检测模块、声纹溯源模块、身份及匿名技术确认模块、正常音频处理模块和身份验证模块,预处理模块与音频输入模块连接,伪造音频检测模块与预处理模块连接,声纹溯源模块和正常音频处理模块均与伪造音频检测模块连接,身份及匿名技术确认模块和身份验证模块分别与声纹溯源模块和正常音频处理模块连接,以此方式解决了现有技术中声纹认证系统在常环境下表现良好,但缺乏足够的机制来识别和防御经过高级匿名技术处理的声音,进而存在伪造音频的检测能力不足、缺乏溯源能力和适应性和灵活性不足的问题的技术问题。
-
公开(公告)号:CN118484161A
公开(公告)日:2024-08-13
申请号:CN202410552355.5
申请日:2024-05-07
Applicant: 南京龙垣信息科技有限公司
IPC: G06F3/16 , G10L25/63 , B60R16/037
Abstract: 本发明涉及通信技术领域,具体涉及一种车载情境感知语音交互系统;包括情感识别模块、环境感知模块、自适应反馈生成模块和交互历史管理模块,情感识别模块和环境感知模块分别与自适应反馈生成模块连接,自适应反馈生成模块与交互历史管理模块连接;情感识别模块用于分析驾驶者的情感状态;环境感知模块用于获取车辆内外部环境信息;自适应反馈生成模块用于根据驾驶者的情感状态和车辆内外部环境信息生成自适应的语音反馈;交互历史管理模块用于维护交互历史记录,通过上述结构,实现根据车辆内外部环境和驾驶者情绪,自适应地调整语音交互。
-
公开(公告)号:CN118280389B
公开(公告)日:2024-11-15
申请号:CN202410365711.2
申请日:2024-03-28
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及语音识别技术领域,具体涉及一种多重对抗判别伪造音频检测系统;包括数据采集模块、波形检测模型、时域特征建模模块和对抗神经网络分类器;波形检测模型用于提取预处理后的原始音频数据中的频谱,基于频谱的连续性判别原始音频是否为真实音频;时域特征建模模块用于对音频波形与特征进行建模;对抗神经网络分类器用于对特征进行判别,再次判别原始音频是否为真实音频;通过对目标音频进行波形频谱分析,采用深度神经网络对于音频波形与特征进行建模,使用对抗神经网络对特征进行判别,从而判断音频来源是否伪造,获得检测出深度音频的伪造,提高检测的准确性和鲁棒性的效果。
-
公开(公告)号:CN118335090A
公开(公告)日:2024-07-12
申请号:CN202410605682.2
申请日:2024-05-16
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及声纹验证技术领域,具体涉及一种声纹验证多模态唤醒方法及设备;包括声纹采集模块、多模态融合模块、多通道声音采集模块、声源定位模块、语音识别模块、操作执行模块和交互模块,声纹采集模块用于采集用户声音样本数据,并建立该用户的声纹特征模型;多通道声音采集模块用于采集多个当前用户发出的声音数据;多模态融合模块用于匹配当前用户与声纹特征模型是否为同一用户;语音识别模块用于识别声音数据的操作任务,并唤醒操作设备;操作执行模块用于执行操作任务;交互模块用于与当前用户进行交互,通过采用匹配当前用户和本地的声纹特征模型的方式进行验证,防止网络延迟导致的用户体验下降。
-
-
-
-
-
-
-
-
-