-
公开(公告)号:CN119068306A
公开(公告)日:2024-12-03
申请号:CN202411087561.X
申请日:2024-08-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N5/04
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
-
公开(公告)号:CN118764480A
公开(公告)日:2024-10-11
申请号:CN202411240717.3
申请日:2024-09-05
Applicant: 南京龙垣信息科技有限公司
IPC: H04L67/06 , H04L41/0631 , H04N1/32
Abstract: 本发明涉及文件传输技术领域,具体涉及一种高性能高可用的数据传输方法及系统;包括下载模块、上传模块和任务监控模块;其中:下载模块,用于下载数据与图片,并生成对应下载任务;上传任务模块,用于上传数据与图片至对应服务器;任务监控模块,用于监测下载模块与上传任务模块的状态;数据传输方法为:首先下载数据与图片,并生成对应下载任务;然后上传数据与图片至对应服务器;最后监测下载与上传过程中的状态;通过特有的设计生成数据文件、图片文件与上传任务,增加数据文件的一致性可靠性以及整体任务的断点续传性,上传任务通关上传到对应服务器,再通过辅助检测整体任务的监控异常状态,提高数据传输性能。
-
公开(公告)号:CN118737146A
公开(公告)日:2024-10-01
申请号:CN202410911980.4
申请日:2024-07-09
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及车辆技术领域,具体涉及一种个性化车载语音助手学习系统及方法,个性化车载语音助手学习系统包括语音识别处理模块、智能响应交互模块、学习适应模块和用户行为分析模块;语音识别处理模块用于捕捉和解析用户的语音指令;智能响应交互模块用于生成个性化的响应并管理整个交互过程;学习适应模块用于不断学习和适应用户的变化;用户行为分析模块用于收集和分析用户的行为数据;本发明综合运用了语音识别、用户行为分析、智能响应生成和持续学习适应的技术,各个模块构成了一个高效、灵活且对用户友好的系统,能够通过长期与用户互动,学习并适应用户的语音习惯、偏好和行为模式,提供个性化服务。
-
公开(公告)号:CN118447845A
公开(公告)日:2024-08-06
申请号:CN202410692309.5
申请日:2024-05-31
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及通信技术领域,具体涉及一种智能客服对话系统及设备;包括用户端、语音交互分类模块、TTS说话人库、文本向量知识库模块和声纹识别模块;语音交互分类模块用于处理用户的语音数据,并理解用户的意图;文本向量知识库模块用于利用向量空间的相似性度量方法,检索到与用户查询相关的信息及解答,并对检索到的信息进行提取和优化处理;TTS说话人库用于将检索到的信息转换为语音,并输出至用户端;通过上述方式,能够更好地理解上下文及捕捉语言的细微差别,并提供更准确的意图识别和实体抽取功能,提高对话过程中的准确性和灵活性。
-
公开(公告)号:CN118260638A
公开(公告)日:2024-06-28
申请号:CN202410465155.6
申请日:2024-04-18
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及数据处理技术领域,具体涉及一种多模态情感识别系统及方法;包括数据收集模块、数据处理模块、语音情感分析模块、图像情感分析模块、情感融合模块和识别输出模块;数据处理模块用于对语音数据和图像数据进行处理;语音情感分析模块用于使用深度学习模型识别情感状态;图像情感分析模块用于使用深度学习模型识别面部表情和情感状态;情感融合模块用于对语音情感分析模块和图像情感分析模块识别出的情感状态进行融合;通过将语音和图像情感分析的结果进行融合,提供了更准确的情绪识别,综合考虑语音和图像两方面的信息,有助于消除单一模态的局限性,实现提高情感识别的可靠性和鲁棒性。
-
公开(公告)号:CN117636880A
公开(公告)日:2024-03-01
申请号:CN202311704931.5
申请日:2023-12-13
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及语音识别技术领域,具体涉及一种用于提升语音外呼辨音准确率的声纹识别方法,包括采集待识别语音信号,并对语音信号进行预处理,得到预处理信号。将所述预处理信号分帧,并对每一帧进行小波包变换,得到多个频带。对多个所述频带进行频域线性预测,以提取语音信号的谐波信息和声道信息,得到语音特征。将所述语音特征进行聚合,得到每个说话人的声纹特征,本发明提供了一种创新性的声纹特征提取方法,通过使用小波包变换、频域线性预测等技术,对语音信号进行高效、准确的特征提取。解决了现有的语音识别技术在语音外呼领域中的准确率较低的问题。
-
公开(公告)号:CN117236333A
公开(公告)日:2023-12-15
申请号:CN202311339881.5
申请日:2023-10-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F40/295 , G06N3/0442 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及信息安全技术领域,具体涉及一种基于威胁情报的复杂命名实体识别方法,包括:从不同专门收集威胁情报的网站获取CTI报告,对获取到的数据进行数据清洗,并构建训练模型的数据集;使用预训练模型RoBERT和BiLSTM获取句子中的词级的向量表示和字符级的向量表示,并将获取到的特征进行拼接;利用CBAM注意力机制和空洞卷积融合实体特征,并使用MLP预测词对关系分数,使用解码器获取最终的识别结果;使用AEDA方法进行数据增强;利用Label Smoothing方法使训练数据标签平滑化;使用训练好的模型对获取的数据进行实体检测;本发明解决了现有的威胁情报实体识别方法难以对威胁情报不规则实体进行准确识别,以及对中英混合实体识别困难的问题。
-
公开(公告)号:CN116312568A
公开(公告)日:2023-06-23
申请号:CN202211090025.6
申请日:2022-09-07
Applicant: 南京龙垣信息科技有限公司
Abstract: 本方案涉及一种语音活动检测方法、装置、计算机设备及存储介质。所述方法包括:随机采样语音片段并加入噪声数据拼接成多人对话仿真录音;通过可学习自监督语音表征模型对仿真录音进行编码处理后输入至门控循环单元中,得到活动语音检测特征;获取目标语者注册语音,并将目标语者注册语音输入至通道注意与传播聚合网络中,得到目标语者声纹特征;采集待检测语音,并将待检测语音、目标语者注册语音输入至双向编码器网络中,得到验证特征;将活动语音检测特征、目标语者声纹特征、验证特征依次输入至语音活动检测模型中,得到检测结果。由于输入的特征多元化,可以提高语音活动检测模型的检测结果,从而提高语音活动检测的准确率。
-
公开(公告)号:CN116051804A
公开(公告)日:2023-05-02
申请号:CN202211378299.5
申请日:2022-11-04
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
Abstract: 本方案涉及一种基于多尺度反瓶颈结构的目标检测方法、装置、计算机设备及存储介质。所述方法包括:获取原始图像并降采样处理,得到降采样图像;对降采样图像进行反瓶颈操作,并根据骨干网络生成特征金字塔网络;通过特征金字塔网络得到不同尺度特征图,并利用无锚框像素级检测在不同尺度特征图上针对不同大小的目标进行多级预测;对多级预测结果进行模型训练后对原始图像进行多级预测以及后处理,得到目标检测框。通过多尺度反瓶颈结构与无锚框检测结合的方式实现图像的多尺度检测,可以避免信息流失,提高信息有效性,以解决现阶段目标检测领域中图像噪点和图像失真导致的目标检测困难问题,提高目标检测的效果。
-
公开(公告)号:CN114880527B
公开(公告)日:2023-03-24
申请号:CN202210648954.8
申请日:2022-06-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F16/901 , G06F16/906 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明公开一种基于多预测任务的多模态知识图谱表示方法,包括如下步骤:基于预设的TransR模型、CBOW模型以及ResNet模型分别获取多模态知识图谱中结构化模态、语义模态和图像模态数据的向量表示;利用Imagined方法将语义模态数据的向量表示与图像模态的向量表示进行匹配、重构得到混合模态的向量表示;基于结构化模态和混合模态的向量表示构建三个跨模态预测任务,并针对三个跨模态预测任务分别利用标签平滑技术和自适应权重更新方法构建全连接神经网络的子模型;整合面向不同预测任务的多个子模型得到完整训练模型。本发明可以完成多模态数据表示学习以及后续的知识图谱补全任务。
-
-
-
-
-
-
-
-
-