-
公开(公告)号:CN118335090A
公开(公告)日:2024-07-12
申请号:CN202410605682.2
申请日:2024-05-16
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及声纹验证技术领域,具体涉及一种声纹验证多模态唤醒方法及设备;包括声纹采集模块、多模态融合模块、多通道声音采集模块、声源定位模块、语音识别模块、操作执行模块和交互模块,声纹采集模块用于采集用户声音样本数据,并建立该用户的声纹特征模型;多通道声音采集模块用于采集多个当前用户发出的声音数据;多模态融合模块用于匹配当前用户与声纹特征模型是否为同一用户;语音识别模块用于识别声音数据的操作任务,并唤醒操作设备;操作执行模块用于执行操作任务;交互模块用于与当前用户进行交互,通过采用匹配当前用户和本地的声纹特征模型的方式进行验证,防止网络延迟导致的用户体验下降。
-
公开(公告)号:CN118053409A
公开(公告)日:2024-05-17
申请号:CN202410190193.5
申请日:2024-02-21
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及背景音效生成技术领域,具体涉及一种背景音效作品生成系统及方法;包括背景音效特征提取模组和背景音效生成模组,背景音效生成模组包括音乐特征采集模块、神经网络生成模块、后处理模块和声码器,神经网络生成模块与音乐特征采集模块连接,所诉神经网络生成模块与音乐特征采集模块连接,后处理模块分别与神经网络生成模块和声码器连接;生成方法为:建立所述背景音效特征提取系统;对所有背景音效数据进行预处理,将背景音效数据成为统一的特征输入;提取背景音效特征;对背景音效特征进行处理,生成背景音效;输出背景音效的语音波形,通过上述方式,实现了能够自动生成高质量的背景音效作品。
-
公开(公告)号:CN117994122A
公开(公告)日:2024-05-07
申请号:CN202410135881.1
申请日:2024-01-31
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06T3/04 , G06T7/90 , G06N3/0464 , G06N3/0475 , G06N3/044 , G06N3/094
Abstract: 本发明涉及计算机视觉技术领域,具体涉及一种基于循环生成对抗网络的图像风格迁移方法;将风格A的图像集和风格B的图像集共同作为训练集,两种风格的图像集分别把对方的风格作为迁移目标,构建一个用于判断图像的风格和是否经过迁移的判别器,两个用于进行风格迁移的生成器;利用推土机距离和梯度惩罚更新判别器,利用循环一致性损失、一致性损失和两个生成器损失更新生成器;通过推土机距离收敛与否判断训练进程;通过实际生成的效果图来调整多优化目标的损失函数的超参数;本发明改善了循环生成对抗网络训练的稳定性,使得训练进程可视化,有效降低了模型训练的难度,可以用于不同数据集的图像风格迁移任务。
-
公开(公告)号:CN117854517A
公开(公告)日:2024-04-09
申请号:CN202410160194.5
申请日:2024-02-05
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及车载智能语音技术领域,具体涉及一种车载多人实时智能语音交互系统;包括声音采集模块、多通道语音增强模块、语音识别模块、自然语音处理模块和语音合成模块,使用车载语音时,通过声音采集模块对声源进行采集,多通道语音增强模块将采集的声源进行多通道自注意力语音增强,随后语音识别模块通过时频域的多通道对齐与语音活动检测后的音频进行说话人聚类,利用自然语音处理模块进行实时语音识别将说话人音频进行语音转文字,最后语音合成模块将转换后的实时转换文字按目标说话人声源进行人机交互处理,实现了能够提高语音的识别率,减少噪声干扰,更准确的远距离语音识别,提升了用户的体验。
-
公开(公告)号:CN117812186A
公开(公告)日:2024-04-02
申请号:CN202410034901.6
申请日:2024-01-09
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及数字信息传输技术领域,具体涉及一种多人匿名元宇宙会议系统及方法,多人匿名元宇宙会议方法包括:建立多个虚拟说话人的TTS说话人库,将输入文字转换成相应说话人的语音输出;对参与者的语音进行语音识别,将参与者的语音输入转化为文本信息;对语音和文本信息进行加密保护,将语音和文本信息进行端到端的加密传输;根据用户选择的匿名身份,在电话会议中生成相应的数字化虚拟人物形象;实时捕捉参与者的面部表情,匿名传输参与者的面部表情;本发明能够为电话会议提供参与者匿名功能,以保护用户的隐私并提升用户体验。
-
公开(公告)号:CN117524253A
公开(公告)日:2024-02-06
申请号:CN202410011919.4
申请日:2024-01-04
Applicant: 南京龙垣信息科技有限公司
IPC: G10L25/30 , G10L25/48 , G10L25/18 , G10L21/007 , G06N3/045 , G06N3/0464 , G06N3/044 , G06N3/09 , H04L65/75 , H04L65/40 , H04L9/00
Abstract: 本发明涉及音频修复技术领域,具体涉及一种针对网络音频丢包的低延迟修复和隐藏方法及其设备;使用短时傅里叶变换将音频信号分成多个时间段,并在每个时间段内计算其频谱表示;使用自回归模型以及循环神经网络模型对其进行建模和预测;使用卷积神经网络对其进行建模和预测;将时域和频域的预测结果进行合并,得到完整的音频信号预测结果;在针对网络音频丢包的低延迟修复和隐藏设备中,包括模型训练模块、数据加密模块和音频修复模块;通过上述方式,实现实时隐藏错误的能力有助于减轻丢包造成的音频损伤,从而提高现实场景中音频播放的质量。
-
公开(公告)号:CN117473124A
公开(公告)日:2024-01-30
申请号:CN202311451594.3
申请日:2023-11-03
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F16/901 , G06F16/835 , G06N3/0895
Abstract: 本发明涉及图表示学习与图数据挖掘技术领域,具体涉及一种具备抵制过度平滑能力的自监督异质图表示学习方法;通过GNN分支和Transformer分支在不同视角下对节点信息进行编码,基于两个视角的信息建立对比学习任务,实现无需样本标注条件下的自监督异质图表示学习,解决了现有GNN消息传递机制的过度平滑限制网络层数的扩展,从而导致模型在面对复杂图数据的表达能力不足的问题,大大增强了模型对远距离邻域信息的捕捉能力。
-
公开(公告)号:CN117423473A
公开(公告)日:2024-01-19
申请号:CN202310324091.3
申请日:2023-03-30
Applicant: 南京龙垣信息科技有限公司
IPC: G16H50/80 , G16H50/70 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06F18/25
Abstract: 本发明提出一种COVID‑19新增感染趋势预测方法和装置,采用多种时间序列分别训练预测模型,获得包含多个维度的特征信息的最终预测结果,不止包含了连续时间的特征,还能包含周期性间隔的时间中所包含的特征信息。并采用多模型综合的方式,可以有效增强方法的鲁棒性和最终的预测精度。
-
公开(公告)号:CN117393050A
公开(公告)日:2024-01-12
申请号:CN202311348087.7
申请日:2023-10-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G16B40/00 , G16B15/20 , G16B30/00 , G06N3/0464 , G06N3/0455 , G06N3/042 , G06N3/0499 , G06N3/08 , G06F18/213
Abstract: 本申请提供一种蛋白质功能识别方法、装置及可读存储介质,涉及生物信息技术领域,其中该方法具体包括:获取目标蛋白质数据,目标蛋白质输入数据包含与待识别的蛋白质相关的蛋白质序列、蛋白质结构和相互作用网络信息;将目标蛋白质数据输入至蛋白质功能识别模型,以由蛋白质功能识别模型输出相应的目标蛋白质功能;蛋白质功能识别模型采用基于Transformer架构的图神经网络,蛋白质功能识别模型被配置成符合面向图数据的层间特征传递自注意力机制。由此,通过组建类似于残差网络的架构的Transformer模型,能较佳地捕获蛋白质序列之间的复杂相互作用关系,保障了蛋白质功能识别结果的精确度。
-
公开(公告)号:CN117056831A
公开(公告)日:2023-11-14
申请号:CN202311322251.7
申请日:2023-10-13
Applicant: 南京龙垣信息科技有限公司
IPC: G06F18/2415 , A61B5/369 , A61B5/00 , A61B5/16 , G06F18/214 , G06F18/213 , G06F18/10 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及数据识别技术领域,具体涉及一种基于卷积神经网络的内心独白识别方法;获取EEG信号;对数据进行预处理;构建基于卷积神经网络的深度学习模型;训练基于EEGNet的深度学习模型;对深度学习模型进行训练,使用k折交叉验证进行测试;输出模型分类结果;通过上述方式,实现在不过度依赖外部刺激和训练的前提下对患者的内心独白进行识别。
-
-
-
-
-
-
-
-
-