-
公开(公告)号:CN119359588B
公开(公告)日:2025-05-02
申请号:CN202411897296.1
申请日:2024-12-23
Applicant: 北京小蝇科技有限责任公司
Abstract: 本发明提供一种基于单实例分布采样的图像数据增广方法,定向对数据库中数据量较少的大多数类别进行数据补充,从根本上缓解数据不均衡造成的尾部类别识别性能较差的问题;基于学习到的单个实例样本的分布采样对数据库进行无限扩充,且扩充后的样本同原始实例样本语义高度相似,但图像细节信息不同,使数据库尽可能涵盖所有可能的图像数据,有效丰富数据库的多样性,有力提升了模型应对各种未知数据时的泛化性能,增强了模型的稳定性,一定程度上解决了模型实际应用时的关键难题;无需对数据进行任何标注,仅需对原始数据进行小规模采集即可将数据库扩充为大规模训练数据库,快速、精准、高效的对数据采集时面临的所有问题进行充分解决。
-
公开(公告)号:CN119129691B
公开(公告)日:2025-03-21
申请号:CN202411620281.0
申请日:2024-11-14
Applicant: 北京小蝇科技有限责任公司
IPC: G06N3/088 , G06N3/0455 , G06N3/09 , G06V10/764 , G06V10/774 , G06V10/82 , G06F16/11
Abstract: 本发明提供一种基于多元信息感知的大规模模型预训练方法,将采集到的图像、文本、音频数据输入预训练数据库,将预训练数据库中小批量标注形成识别数据库,利用预训练数据库中的数据对识别模型进行无监督模式预训练,预训练分别从三个感知态展开,将预训练模型得到的参数作为识别模型的初始化参数,基于识别数据库进行模型的监督学习训练,得到最终的智能识别模型。本发明以无监督学习为基石,依托大规模模型预训练的强大能力,分别利用判别式模型和生成式模型进行大规模模型预训练,实现了对海量无标注数据的有效利用;支持广泛的多模态数据的输入,采用互信息最大化‑对比损失作为核心优化目标,使模型能够流畅的处理多模态数据间复杂关系。
-
公开(公告)号:CN119478568A
公开(公告)日:2025-02-18
申请号:CN202510065492.0
申请日:2025-01-16
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于噪声抑制和多尺度特征融合的图像分类方法,包括建立数据集、建立细粒度图像分类模型、建立损失函数,利用训练集、验证集和测试集分别训练、验证和测试细粒度图像分类模型得到训练好的细粒度图像分类模型并进行图像分类得到分类结果。本发明通过引入噪声抑制模块和多尺度特征融合模块,旨在降低背景噪声的同时,在不同尺度的前景区域获取细粒度类别判别特征表示的可能,从而使得细粒度的特征表示汇聚了浅层特征和深层特征,提高了模型对于细粒度分类任务的性能。
-
公开(公告)号:CN118916701B
公开(公告)日:2024-12-20
申请号:CN202411414096.6
申请日:2024-10-11
Applicant: 北京小蝇科技有限责任公司
IPC: G06F18/214 , G06F18/21 , G06F18/241 , G06N5/022 , G06F16/332 , G06F16/36 , G16H50/20 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供一种基于知识蒸馏的呼吸暂停知识问答模型训练方法,采用知识蒸馏的掩码语言训练模块和自监督的掩码语言训练模块,并结合重构损失和分类损失,经过呼吸暂停领域的知识训练,从教师模型中提取关键知识,并将其转移到轻量级模型中;自监督掩码语言训练模块使得学生模型能够在下游任务提供的语料信息下,并基于其提供的上下文信息,实现文本句子的补全和修正。本发明实现了在保持高准确率的同时,提高了问答系统的响应速度,这对于普及呼吸暂停相关知识、辅助快速诊断、提供个性化治疗建议等方面具有显著的有益效果,进而促进了医疗资源的合理分配和医疗服务质量的提升。
-
公开(公告)号:CN118747829B
公开(公告)日:2024-11-05
申请号:CN202411098781.2
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/764 , G06V10/774
Abstract: 本发明提供一种基于带噪数据的图像识别方法和装置,所述方法包括:将待识别的原始图像输入预先训练的分类识别模型,得到所述分类识别模型输出的图像识别结果;分类识别模型是利用预先构建的图像样本数据集进行训练得到的,图像样本数据集包括干净样本数据集和噪声样本数据集;干净样本数据集包括在原始数据样本中筛除难以分类样本集合后得到的干净样本集合,以及难以分类样本集合经过噪声识别模型筛选后得到的难以识别样本集合;噪声样本数据集是所述难以分类样本集合经过噪声识别模型筛选后得到的噪声样本集合构成的。解决了由于样本类型识别和标注不够准确而导致的训练出的识别模型准确性较差的问题。
-
公开(公告)号:CN118747890A
公开(公告)日:2024-10-08
申请号:CN202411098787.X
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V20/69 , G06V40/10 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/042 , G06N3/09 , G06N3/096
Abstract: 本发明提供一种基于人工智能的疟原虫分类识别方法和装置,所述方法包括:获取待识别的原始图像;将所述待识别的原始图像输入预先训练的分类识别模型,得到所述分类识别模型输出的疟原虫类别识别结果;其中,所述分类识别模型是利用多个专家模型进行嵌套学习得到的,所述嵌套学习包括对每个所述专家模型进行嵌套个体学习,以及对多个专家模型之间进行嵌套平衡在线蒸馏。解决了现有技术中存在的数据样本较少、且样本数据在类别上数量不均衡而导致的疟原虫识别准确性较差的问题。
-
公开(公告)号:CN118747797A
公开(公告)日:2024-10-08
申请号:CN202411098789.9
申请日:2024-08-12
Applicant: 北京小蝇科技有限责任公司
IPC: G06V10/25 , G06V20/70 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/74 , G06V10/82 , G06V10/774 , G06V10/776 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06F40/30 , G06F18/25
Abstract: 本发明提供一种基于深度学习的图像处理方法和装置,所述方法包括:获取待检测的图像数据,将所述图像数据与输入的提示信息相融合,以得到输入数据;将所述输入数据输入预先构建的目标检测模型,以得到所述目标检测模型输出的目标检测结果;其中,所述目标检测模型是基于预先构建的深度学习网络,利用自然图像样本、与所述自然图像样本对应的提示信息,以及标签信息进行训练得到的。解决了现有技术中图像处理过程中目标检测缺少交互能力,图像处理效果受限的技术问题。
-
公开(公告)号:CN114419619B
公开(公告)日:2022-06-10
申请号:CN202210316532.0
申请日:2022-03-29
Applicant: 北京小蝇科技有限责任公司
Abstract: 本发明公开了一种红细胞检测分类方法、装置、计算机存储介质及电子设备,属于血细胞检测领域。本发明首先对大量血液玻片进行全视野摄影,建立玻片扫描图像组。从玻片扫描图像组中分别为图像复原模型、图像检测和多任务分类模型准备训练数据集和验证数据集。使用深度学习和卷积神经网络技术进行模型训练,通过不断地参数调优和误差分析优化模型,得到最终的图像复原模型、图像检测和多任务分类模型。在应用过程中,待检测血液玻片同样进行全视野摄影,建立玻片扫描图像。通过图像复原模型获得复原后的清晰玻片扫描图像,经过图像检测和多任务分类模型,得到红细胞的位置和类别。本发明能够快速、全面、准确、客观的实现红细胞检测分类。
-
公开(公告)号:CN114418863B
公开(公告)日:2022-06-07
申请号:CN202210332142.2
申请日:2022-03-31
Applicant: 北京小蝇科技有限责任公司
Abstract: 本发明公开了一种细胞图像修复方法、装置、计算机存储介质及电子设备,属于图像处理领域。该方法包括:对大量细胞玻片样本进行全视野摄影,得到玻片扫描图像组;从玻片扫描图像组中准备训练数据集和验证数据集,对基于transformer模型框架的图像修复模型进行训练;对待测血液玻片进行全视野摄影,得到玻片扫描图像;将玻片扫描图像输入训练后的图像修复模型,输出得到修复图像。本发明对观测距离较大的较低分辨率的细胞图像进行超分辨率在线修复,帮助观察者在足够大的视野范围下精确地评估细胞。
-
公开(公告)号:CN114418863A
公开(公告)日:2022-04-29
申请号:CN202210332142.2
申请日:2022-03-31
Applicant: 北京小蝇科技有限责任公司
Abstract: 本发明公开了一种细胞图像修复方法、装置、计算机存储介质及电子设备,属于图像处理领域。该方法包括:对大量细胞玻片样本进行全视野摄影,得到玻片扫描图像组;从玻片扫描图像组中准备训练数据集和验证数据集,对基于transformer模型框架的图像修复模型进行训练;对待测血液玻片进行全视野摄影,得到玻片扫描图像;将玻片扫描图像输入训练后的图像修复模型,输出得到修复图像。本发明对观测距离较大的较低分辨率的细胞图像进行超分辨率在线修复,帮助观察者在足够大的视野范围下精确地评估细胞。
-
-
-
-
-
-
-
-
-