一种提高RAG技术文本生成内容可解释性的方法及系统

    公开(公告)号:CN119862956A

    公开(公告)日:2025-04-22

    申请号:CN202411815176.2

    申请日:2024-12-11

    Inventor: 李林 张渤 许娟

    Abstract: 本发明涉及自然语言处理技术领域,具体公开一种提高RAG技术文本生成内容可解释性的方法及系统,该方法包括:针对RAG技术的检索阶段,根据问题文本关联的每个文档片段与问题文本的语义相似度,确定每个文档片段的归一化权重值;归一化权重值表征文档片段对于生成文本的贡献程度;针对RAG技术的生成阶段,获取生成文本中的每个生成单词在生成过程中所依赖的目标文档片段及目标文档片段对应的注意力权重值;注意力权重值表征生成单词在生成过程中所依赖的目标文档片段的重要程度。本发明通过透明化RAG技术的检索过程与生成过程,并提供文本生成内容清晰、可追溯的解释,能够提升RAG技术在高可信度要求领域的可解释性和透明度。

    融合图像识别、大模型和PRS的疾病预测方法及系统

    公开(公告)号:CN119296791A

    公开(公告)日:2025-01-10

    申请号:CN202411812532.5

    申请日:2024-12-10

    Inventor: 张渤 李林 许娟

    Abstract: 本发明涉及人工智能中的医疗数据处理技术领域,特别涉及融合图像识别、大模型和PRS的疾病预测方法及系统,该方法包括:获取初始GWAS芯片基因型数据;获取亚洲人群的GWAS Summary数据,计算并形成PRS矩阵;对PRS矩阵进行维度转化处理和归一化处理;对归一化映射PRS分值进行叠加处理,生成PRS图像数据;训练并验证图像识别模型;训练并验证多模态大语言模型;采用图像识别模型和多模态大语言模型进行疾病预测。本发明利用图像识别的特征与识别能力,综合考虑多个PRS分值对于同一表型的影响,不仅可以有效规避偏向性问题,还能够有效提高模型预测结果的准确性和可靠性;结合多模态大语言模型的多标签能力,能够实现对同一张PRS图像数据进行多种疾病的结果预测。

    一种基于多源数据的数据处理系统

    公开(公告)号:CN119862403A

    公开(公告)日:2025-04-22

    申请号:CN202411836697.6

    申请日:2024-12-13

    Abstract: 本发明涉及一种基于多源数据的数据处理系统,包括:用户操作界面模块,用于获取用户上传的多维数据,以及获取用户选择的多维数据的目标分析任务,以及获取用户选择的目标机器学习算法模型;特征筛选模块,用于根据目标变量,从多维数据中选择与目标变量的相关特征;机器学习模型模块,用于为用户提供针对不同的分析任务对应的机器学习算法模型;模型训练模块,用于根据与目标变量的相关特征,对目标机器学习算法模型进行训练,得到目标模型,以基于目标模型对与目标变量的相关特征进行目标分析任务对应的处理。通过本发明的系统,能够帮助用户高效处理、分析多维数据,自动进行机器学习建模,且支持个性化的处理。

    一种ICU患者脓毒症发生风险预测方法及系统

    公开(公告)号:CN119581018A

    公开(公告)日:2025-03-07

    申请号:CN202411629785.9

    申请日:2024-11-15

    Inventor: 酒连娣 张渤 许娟

    Abstract: 本发明公开了一种ICU患者脓毒症发生风险预测方法及系统,该方法包括:采集ICU患者的临床时序数据;基于结构化查询语言技术和语义分析模型对ICU患者的临床时序数据进行信息提取处理;构造出数据集;构建八种二分类机器学习模型,选取AUROC值最高的二分类机器学习模型作为脓毒症预测模型;筛选有效特征;采用Platt Scaling算法和校准集对脓毒症预测模型进行校准处理,得到校准后的脓毒症预测模型;获取目标ICU患者的实时临床时序数据,对目标ICU患者的实时临床时序数据进行预处理,并输入至校准后的脓毒症预测模型中,输出且显示脓毒症发生风险预测结果。本发明无需人为干预,能够对ICU患者的脓毒症发生风险进行实时监测,以便为脓毒症的早期预警提供重要支持。

    术后心力衰竭风险预测方法、系统、电子设备和存储介质

    公开(公告)号:CN120032877A

    公开(公告)日:2025-05-23

    申请号:CN202510015011.5

    申请日:2025-01-06

    Abstract: 本发明涉及机器学习技术领域,具体公开一种术后心力衰竭风险预测方法、系统、电子设备和存储介质,该方法包括:确定用于术后心力衰竭风险预测的目标机器学习模型与多个目标特征指标,并根据每个样本患者的多个目标特征指标的具体值以及表征每个样本患者是否存在术后心力衰竭的样本标签,对所述目标机器学习模型进行训练,得到训练好的机器学习模型;将待测患者的多个目标特征指标的具体值输入至所述训练好的机器学习模型,得到所述待测患者的术后心力衰竭风险预测结果。本发明能够简化临床工作流程,提高术后心力衰竭风险评估的准确性和效率,最终实现更好的患者监测以及护理。

Patent Agency Ranking