-
公开(公告)号:CN116071822A
公开(公告)日:2023-05-05
申请号:CN202310004312.9
申请日:2023-01-03
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
IPC: G06V40/20 , G06F40/289 , G06V20/40 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本申请公开了一种手语识别方法及相关装置、设备、存储介质,手语识别方法包括:获取分句视频帧序列,分句视频帧序列是对手语动作序列进行采集得到,分句视频帧序列中的手语动作所表达内容为一个分句;对分句视频帧序列按照分词进行划分,得到若干分词视频帧序列,分句视频帧序列中的手语动作所表达内容为一个分词;对各分词视频帧序列进行动作识别,得到各分词视频帧序列对应的分词;利用各分词视频帧序列对应的分词,得到分句视频帧序列对应的分句。上述方案,能够提高视频通话沟通效率。
-
公开(公告)号:CN119850474A
公开(公告)日:2025-04-18
申请号:CN202411820220.9
申请日:2024-12-11
Applicant: 科大讯飞股份有限公司
IPC: G06T5/77 , G06T5/60 , G06T5/70 , G06N3/0455 , G06T7/42
Abstract: 本发明涉及图像处理技术领域,提供一种图像填充方法、装置、电子设备和存储介质,其中方法包括:对文本提示词进行编码,得到文本编码向量,并对掩码后的背景图像进行编码,得到图像编码向量;将图像编码向量、位置掩码以及随机噪声进行拼接,得到融合噪声向量;对融合噪声向量进行逐步去噪,并在去噪过程中加入文本编码向量和纹理引导向量作为引导条件,生成填充图像,纹理引导向量是基于对前景图像的纹理特征和背景图像的纹理特征进行拼接、平滑过渡以及编码处理后得到的。本发明通过逐步去噪的过程,并结合文本编码向量和纹理引导向量作为双重引导条件,可以生成细节丰富、纹理自然且与背景图像高度融合的填充图像。
-
公开(公告)号:CN117474949A
公开(公告)日:2024-01-30
申请号:CN202311381202.0
申请日:2023-10-23
Applicant: 科大讯飞华南人工智能研究院(广州)有限公司 , 科大讯飞股份有限公司
Abstract: 本申请提出一种运动计数方法、装置、系统、电子设备及存储介质,该方法获取运动目标的运动图像序列,运动图像序列中包括至少两帧包含所述运动目标的图像;对运动图像序列所包含的各帧图像,进行空间维度和时间维度的图像特征交互处理,得到运动图像序列的各帧图像的交互图像特征;基于运动图像序列的各帧图像的交互图像特征,对各帧图像进行特定动作分类处理,并根据分类结果确定运动目标执行特定动作的次数。采用本申请的技术方案,能够实现多帧图像在时间维度和空间维度上的深度交互,在进行图像分类时,结合了前后帧图像的信息,从而能够提高对运动图像进行运动动作分类的准确度,进而提高运动数量的检测准确度。
-
公开(公告)号:CN119941648A
公开(公告)日:2025-05-06
申请号:CN202411974152.1
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
Abstract: 本发明涉及医学影像分析,具体涉及一种基于先验位置信息的医学影像分析方法,根据不同部位的重要性程度,初始化分管不同区域的可学习Queries;输入3D医学影像,根据先验位置信息在相应区域提取3D视觉特征,并在所有3D视觉特征中提取特定区域的局部特征;对各区域的可学习Queries与各区域的局部特征进行特征交互学习,得到各区域的视觉交互特征;利用分类头基于目标区域的视觉交互特征进行分类,并对分类结果进行文本化处理,得到目标区域的分类结果文本化描述;根据目标区域的视觉交互特征、分类结果文本化描述和用户指令文本得到目标区域的文本报告;本发明提供的技术方案能够有效克服难以准确生成目标区域文本报告的缺陷。
-
公开(公告)号:CN119920443A
公开(公告)日:2025-05-02
申请号:CN202411979903.9
申请日:2024-12-31
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
Abstract: 本发明涉及医学影像分析,具体涉及基于多模态大模型的医学影像分析系统,多模态特征提取器,提取当前病例中医学影像的视觉特征信息,以及当前病例中病人信息的文本特征信息,融合视觉特征信息和文本特征信息得到当前病例的多模态特征;多模态RAG模块,根据当前病例的多模态特征从专科临床数据库、典型病例知识库中分别检索与当前病例相关的专科临床知识、典型病例数据,并作为检索增强信息发送给医学影像多模态大模型;医学影像多模态大模型,根据当前病例的多模态特征、检索增强信息,以及反馈与修正建议,提供医学影像分析结果及其相关服务;本发明提供的技术方案能够有效克服现有技术所存在的难以对医学影像进行准确、高效分析的缺陷。
-
公开(公告)号:CN119919762A
公开(公告)日:2025-05-02
申请号:CN202411974159.3
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
IPC: G06V10/778 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于人工反馈的交互式医疗影像标注与模型优化方法,属于医疗影像分析技术领域,该基于人工反馈的交互式医疗影像标注与模型优化方法,结合人工反馈和深度学习模型的优势,通过医学专业人员人工审核校正后的疾病标签和热图定位标签作为训练监督信号,反向传播优化模型参数,从而提升模型对疾病诊断和定位的能力,相较现有技术,通过改进深层次认知和复杂模型学习策略,使模型能够更好地捕获和理解疾病区域的详细信息,从而提高了对医疗影像的分类与定位能力。
-
公开(公告)号:CN119831939A
公开(公告)日:2025-04-15
申请号:CN202411838622.1
申请日:2024-12-13
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
IPC: G06T7/00 , G06N3/0455 , G06N3/09 , G16H15/00 , G06V10/764 , G06V10/82 , G16H50/20
Abstract: 本发明涉及医学影像智能分析,具体涉及一种医学影像智能分析模型及训练方法,视觉特征编码器,对输入的医学影像进行医学影像特征提取,并将医学影像特征输入至记忆激活选择器;记忆激活选择器,根据医学影像特征提取视觉诊断特征,通过计算视觉诊断特征与疾病诊断记忆库存储的疾病诊断知识之间的相似性获取对应激活的记忆索引,对记忆索引进行去重,根据去重后的记忆索引获取对应激活的记忆特征组合,并将记忆特征组合作为指令前缀,与用户指令一同输入至大语言模型解码器;本发明提供的技术方案能够有效克服现有技术所存在的难以对医学影像进行精准分析,以及不便对医学影像智能分析模型进行便捷的拓展性学习的缺陷。
-
公开(公告)号:CN119943338A
公开(公告)日:2025-05-06
申请号:CN202411974160.6
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
Abstract: 本发明公开了一种基于大规模语言模型的辅助诊疗系统,属于医疗影像分析技术领域,包括基于大规模预训练语言模型的医疗影像智能体、工具组件以及储存池模块,所述医疗影像智能体将自然语言解析转化为具体的任务提示,并匹配、调用工具组件,所述工具组件包括报告生成模块、影像分割模块、病灶检测模块、报告评估模块、诊疗助手模块以及储存池模块。该基于大规模语言模型的辅助诊疗系统,通过医疗影像智能体将用户输入的自然语言解析转化为具体的任务提示,自动分解复杂的医疗影像问题,并匹配、调用工具组件,生成详细的分步解决方案,相较现有的装置,避免了由于操作较为复杂且不够直观的问题,简化操作、降低了使用门槛。
-
公开(公告)号:CN119942185A
公开(公告)日:2025-05-06
申请号:CN202411974150.2
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/77 , G06V10/82 , G06V10/44 , G06N3/0464 , G06N3/0455 , G06N5/04 , G06T7/00
Abstract: 本发明涉及医学影像分析,具体涉及一种基于细粒度特征的医学影像分析方法,模仿医生实际观看医学影像时的阅读模式,将3D医学影像划分为多层2D医学影像进行输入;对每层2D医学影像进行ViT编码,得到每层2D医学影像的ViT编码结果;对每层2D医学影像的ViT编码结果分别进行上采样、下采样,得到对应的上采样特征、下采样特征;根据每层2D医学影像的下采样特征,利用层级特征采样器提取每层2D医学影像的层级特征;根据每层2D医学影像的层级特征,利用层级特征聚合器提取每层2D医学影像的层级聚合特征;本发明提供的技术方案能够有效克服现有技术所存在的难以对3D医学影像进行准确、高效分析的缺陷。
-
公开(公告)号:CN119941649A
公开(公告)日:2025-05-06
申请号:CN202411974161.0
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
IPC: G06T7/00 , G06T7/11 , G06T7/73 , G06N3/045 , G06N5/04 , G06N5/022 , G06V20/70 , G06V10/42 , G06V10/82
Abstract: 本发明公开了一种基于大模型的病灶定位方法,属于医疗影像分析技术领域,图像经过图像编码器后输入病灶检测模块与病灶分割模块,输出病灶特征,通过区域编码器对每个病灶特征进行处理并整理为大小一致的特征图,再输入给大语言模型,大语言模型整合特征图、全局特征、相似病例以及用户的prompt,输出医疗影像报告,本发明相较现有技术,避免了需要手动对比影像中的病灶位置和报告中的文字描述的问题,提高了诊断效率。
-
-
-
-
-
-
-
-
-