-
公开(公告)号:CN119961482A
公开(公告)日:2025-05-09
申请号:CN202510437140.3
申请日:2025-04-09
Applicant: 先进计算与关键软件(信创)海河实验室 , 天津市公安局科技信息化总队
IPC: G06F16/632 , G06F16/683 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0895 , G06F18/10 , G06F18/22 , G06F18/27 , G06N5/04
Abstract: 本发明涉及语音识别与自然语言处理技术领域,具体公开了一种基于检索增强的执法记录仪音频语义检索方法及系统,系统包括:数据获取模块,用于获取音频数据和文本查询;语音适配器模块,用于将音频数据投影到文本嵌入空间,得到语音表示;跨模态检索器,用于对语音表示和文本查询进行跨模态检索,得到语音Tokens;语音语言模型,用于得到的文字假设;查询生成模块,用于提取可能包含实体名称的查询片段;实体检索模块,用于根据查询片段,检索实体数据库,得到相关实体名称;上下文构建模块,用于构建上下文信息;大语言模型,用于得到语义检索结果。本发明提高执法记录仪音频中实体名称和关键信息的识别与检索准确性。
-
公开(公告)号:CN119578393A
公开(公告)日:2025-03-07
申请号:CN202510135450.X
申请日:2025-02-07
Applicant: 先进计算与关键软件(信创)海河实验室 , 北京泛图时空科技有限公司
IPC: G06F40/186 , G06F40/30 , G06F16/783 , G06F18/213 , G06F18/27 , G06F18/20
Abstract: 本发明涉及人工智能技术领域,具体公开了基于执法记录仪视频的处警过程报告智能生成方法及系统,方法包括:获取执法记录仪视频数据和查询文本;执法记录仪视频数据分离得到视频流数据和音频流数据;对音频流数据进行识别,得到音频文本;对视频流数据和音频文本进行语义分析,得到多模态情感分析语义特征;根据视频流数据和查询文本,得到片段对应的视觉语义特征;根据片段对应的视觉语义特征和多模态情感分析语义特征,确定案件类型,调用对应的处警过程报告模板,生成处警过程报告。本发明能够快速分析执法记录仪视频中的音视频数据,提取关键信息,并生成准确、详细且具时效性的处警过程报告。
-
公开(公告)号:CN118571402B
公开(公告)日:2024-10-29
申请号:CN202411061731.7
申请日:2024-08-05
Applicant: 先进计算与关键软件(信创)海河实验室
IPC: G16H15/00 , G06N3/0455 , G06N3/0464 , G06N5/04 , G06F18/22
Abstract: 本发明涉及人工智能以及检索技术领域,具体公开了基于检索增强的医疗质控报告智能生成方法及系统,方法包括构建医疗影像质控的图文对数据;构建图像嵌入模型和文本嵌入模型;构建三元仿射变换器并训练;部署向量数据库;部署多模态大模型并训练;部署大语言模型;得到医疗质控报告智能生成系统;将图像和提示词输入所述医疗质控报告智能生成系统,生成医疗质控报告。本发明能够有效整合临床数据和最新医疗知识,智能高效的生成医疗质控报告,提高了医疗质控报告的可靠性和专业性。
-
公开(公告)号:CN118571402A
公开(公告)日:2024-08-30
申请号:CN202411061731.7
申请日:2024-08-05
Applicant: 先进计算与关键软件(信创)海河实验室
IPC: G16H15/00 , G06N3/0455 , G06N3/0464 , G06N5/04 , G06F18/22
Abstract: 本发明涉及人工智能以及检索技术领域,具体公开了基于检索增强的医疗质控报告智能生成方法及系统,方法包括构建医疗影像质控的图文对数据;构建图像嵌入模型和文本嵌入模型;构建三元仿射变换器并训练;部署向量数据库;部署多模态大模型并训练;部署大语言模型;得到医疗质控报告智能生成系统;将图像和提示词输入所述医疗质控报告智能生成系统,生成医疗质控报告。本发明能够有效整合临床数据和最新医疗知识,智能高效的生成医疗质控报告,提高了医疗质控报告的可靠性和专业性。
-
-
-