-
公开(公告)号:CN119048564B
公开(公告)日:2025-03-21
申请号:CN202411546997.0
申请日:2024-11-01
Applicant: 北京小蝇科技有限责任公司
IPC: G06T7/246 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种长短期目标记忆的多目标追踪方法,基于DETR结构的启发,首先拓展DETR中query的物理概念为检测query和追踪query,辅以追踪感知的标签匹配策略,实现检测和追踪任务的解耦;其次嵌入记忆模块,传递以及更新连续帧之间的标签匹配信息,提高模型对于长短期目标的记忆能力,使得模型足以解决复杂的时序建模问题。本发明在首帧图片缺乏追踪信息的前提下,依赖检测模型完成目标的定位以及索引的分配;对于后续帧的目标检测以及追踪而言,记忆模块可提供有效的追踪信息,且置信度进入阈值和置信度退出阈值可协同筛选出高质量的追踪信息,完成目标轨迹的空间建模;本发明显著提高在目标的不规则运动、目标的运动模糊以及目标遮挡场景下的多目标追踪性能。
-
公开(公告)号:CN118747797B
公开(公告)日:2024-11-01
申请号:CN202411098789.9
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/25 , G06V20/70 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/74 , G06V10/82 , G06V10/774 , G06V10/776 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06F40/30 , G06F18/25
Abstract: 本发明提供一种基于深度学习的图像处理方法和装置,所述方法包括:获取待检测的图像数据,将所述图像数据与输入的提示信息相融合,以得到输入数据;将所述输入数据输入预先构建的目标检测模型,以得到所述目标检测模型输出的目标检测结果;其中,所述目标检测模型是基于预先构建的深度学习网络,利用自然图像样本、与所述自然图像样本对应的提示信息,以及标签信息进行训练得到的。解决了现有技术中图像处理过程中目标检测缺少交互能力,图像处理效果受限的技术问题。
-
公开(公告)号:CN119478568A
公开(公告)日:2025-02-18
申请号:CN202510065492.0
申请日:2025-01-16
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于噪声抑制和多尺度特征融合的图像分类方法,包括建立数据集、建立细粒度图像分类模型、建立损失函数,利用训练集、验证集和测试集分别训练、验证和测试细粒度图像分类模型得到训练好的细粒度图像分类模型并进行图像分类得到分类结果。本发明通过引入噪声抑制模块和多尺度特征融合模块,旨在降低背景噪声的同时,在不同尺度的前景区域获取细粒度类别判别特征表示的可能,从而使得细粒度的特征表示汇聚了浅层特征和深层特征,提高了模型对于细粒度分类任务的性能。
-
公开(公告)号:CN118916701B
公开(公告)日:2024-12-20
申请号:CN202411414096.6
申请日:2024-10-11
Applicant: 北京小蝇科技有限责任公司
IPC: G06F18/214 , G06F18/21 , G06F18/241 , G06N5/022 , G06F16/332 , G06F16/36 , G16H50/20 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供一种基于知识蒸馏的呼吸暂停知识问答模型训练方法,采用知识蒸馏的掩码语言训练模块和自监督的掩码语言训练模块,并结合重构损失和分类损失,经过呼吸暂停领域的知识训练,从教师模型中提取关键知识,并将其转移到轻量级模型中;自监督掩码语言训练模块使得学生模型能够在下游任务提供的语料信息下,并基于其提供的上下文信息,实现文本句子的补全和修正。本发明实现了在保持高准确率的同时,提高了问答系统的响应速度,这对于普及呼吸暂停相关知识、辅助快速诊断、提供个性化治疗建议等方面具有显著的有益效果,进而促进了医疗资源的合理分配和医疗服务质量的提升。
-
公开(公告)号:CN118747797A
公开(公告)日:2024-10-08
申请号:CN202411098789.9
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/25 , G06V20/70 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/74 , G06V10/82 , G06V10/774 , G06V10/776 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06F40/30 , G06F18/25
Abstract: 本发明提供一种基于深度学习的图像处理方法和装置,所述方法包括:获取待检测的图像数据,将所述图像数据与输入的提示信息相融合,以得到输入数据;将所述输入数据输入预先构建的目标检测模型,以得到所述目标检测模型输出的目标检测结果;其中,所述目标检测模型是基于预先构建的深度学习网络,利用自然图像样本、与所述自然图像样本对应的提示信息,以及标签信息进行训练得到的。解决了现有技术中图像处理过程中目标检测缺少交互能力,图像处理效果受限的技术问题。
-
公开(公告)号:CN118628843B
公开(公告)日:2024-12-20
申请号:CN202411098784.6
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/042 , G06F16/55 , G06F16/583 , G06F16/58 , G06F40/284 , G06F40/216 , G06F18/25
Abstract: 本发明提供一种用于医疗数据的长尾目标数据分类方法和装置,所述方法包括:在长尾目标数据库中获取待分类的目标图像,在所述目标图像中增加类别文本描述,以得到输入数据;将所述输入数据输入预先训练的分类识别模型,得到所述分类识别模型输出的分类结果;其中,所述分类识别模型是利用样本数据和预先构建的网络模型进行训练得到的;所述样本数据是在收集到的自然图像中增加类别文本描述得到的,所述网络模型包括预先构建的编码器、图像特征分类头和文图指导图像特征分类头。解决了现有技术中长尾分类的准确性和泛化性较差的问题,提高了长尾分类的准确性和泛化性。
-
公开(公告)号:CN119048564A
公开(公告)日:2024-11-29
申请号:CN202411546997.0
申请日:2024-11-01
Applicant: 北京小蝇科技有限责任公司
IPC: G06T7/246 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种长短期目标记忆的多目标追踪方法,基于DETR结构的启发,首先拓展DETR中query的物理概念为检测query和追踪query,辅以追踪感知的标签匹配策略,实现检测和追踪任务的解耦;其次嵌入记忆模块,传递以及更新连续帧之间的标签匹配信息,提高模型对于长短期目标的记忆能力,使得模型足以解决复杂的时序建模问题。本发明在首帧图片缺乏追踪信息的前提下,依赖检测模型完成目标的定位以及索引的分配;对于后续帧的目标检测以及追踪而言,记忆模块可提供有效的追踪信息,且置信度进入阈值和置信度退出阈值可协同筛选出高质量的追踪信息,完成目标轨迹的空间建模;本发明显著提高在目标的不规则运动、目标的运动模糊以及目标遮挡场景下的多目标追踪性能。
-
公开(公告)号:CN118628843A
公开(公告)日:2024-09-10
申请号:CN202411098784.6
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/042 , G06F16/55 , G06F16/583 , G06F16/58 , G06F40/284 , G06F40/216 , G06F18/25
Abstract: 本发明提供一种用于医疗数据的长尾目标数据分类方法和装置,所述方法包括:在长尾目标数据库中获取待分类的目标图像,在所述目标图像中增加类别文本描述,以得到输入数据;将所述输入数据输入预先训练的分类识别模型,得到所述分类识别模型输出的分类结果;其中,所述分类识别模型是利用样本数据和预先构建的网络模型进行训练得到的;所述样本数据是在收集到的自然图像中增加类别文本描述得到的,所述网络模型包括预先构建的编码器、图像特征分类头和文图指导图像特征分类头。解决了现有技术中长尾分类的准确性和泛化性较差的问题,提高了长尾分类的准确性和泛化性。
-
公开(公告)号:CN118916701A
公开(公告)日:2024-11-08
申请号:CN202411414096.6
申请日:2024-10-11
Applicant: 北京小蝇科技有限责任公司
IPC: G06F18/214 , G06F18/21 , G06F18/241 , G06N5/022 , G06F16/332 , G06F16/36 , G16H50/20 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供一种基于知识蒸馏的呼吸暂停知识问答模型训练方法,采用知识蒸馏的掩码语言训练模块和自监督的掩码语言训练模块,并结合重构损失和分类损失,经过呼吸暂停领域的知识训练,从教师模型中提取关键知识,并将其转移到轻量级模型中;自监督掩码语言训练模块使得学生模型能够在下游任务提供的语料信息下,并基于其提供的上下文信息,实现文本句子的补全和修正。本发明实现了在保持高准确率的同时,提高了问答系统的响应速度,这对于普及呼吸暂停相关知识、辅助快速诊断、提供个性化治疗建议等方面具有显著的有益效果,进而促进了医疗资源的合理分配和医疗服务质量的提升。
-
-
-
-
-
-
-
-