一种基于多源数据的数据处理系统

    公开(公告)号:CN119862403A

    公开(公告)日:2025-04-22

    申请号:CN202411836697.6

    申请日:2024-12-13

    Abstract: 本发明涉及一种基于多源数据的数据处理系统,包括:用户操作界面模块,用于获取用户上传的多维数据,以及获取用户选择的多维数据的目标分析任务,以及获取用户选择的目标机器学习算法模型;特征筛选模块,用于根据目标变量,从多维数据中选择与目标变量的相关特征;机器学习模型模块,用于为用户提供针对不同的分析任务对应的机器学习算法模型;模型训练模块,用于根据与目标变量的相关特征,对目标机器学习算法模型进行训练,得到目标模型,以基于目标模型对与目标变量的相关特征进行目标分析任务对应的处理。通过本发明的系统,能够帮助用户高效处理、分析多维数据,自动进行机器学习建模,且支持个性化的处理。

    一种文本向量表示方法、装置、电子设备及存储介质

    公开(公告)号:CN119849436A

    公开(公告)日:2025-04-18

    申请号:CN202411912226.9

    申请日:2024-12-24

    Abstract: 本发明涉及一种文本向量表示方法、装置、电子设备及存储介质,该方法包括:获取待表示文本,所述待表示文本中包括多个文本片段;确定每个所述文本片段的静态嵌入向量以及位置向量;根据所有文本片段的静态嵌入向量和位置向量,确定各个所述文本片段之间的关联关系;根据所有文本片段的静态嵌入向量、位置向量和关联关系,确定所述待表示文本的文本向量。通过本发明的方法,不但保留了文本片段本身所表征的文本特征,还结合了文本片段之间的关联关系,可更加准确的对待表示文本进行准确的文本向量表示。

    一种ICU患者脓毒症发生风险预测方法及系统

    公开(公告)号:CN119581018A

    公开(公告)日:2025-03-07

    申请号:CN202411629785.9

    申请日:2024-11-15

    Inventor: 酒连娣 张渤 许娟

    Abstract: 本发明公开了一种ICU患者脓毒症发生风险预测方法及系统,该方法包括:采集ICU患者的临床时序数据;基于结构化查询语言技术和语义分析模型对ICU患者的临床时序数据进行信息提取处理;构造出数据集;构建八种二分类机器学习模型,选取AUROC值最高的二分类机器学习模型作为脓毒症预测模型;筛选有效特征;采用Platt Scaling算法和校准集对脓毒症预测模型进行校准处理,得到校准后的脓毒症预测模型;获取目标ICU患者的实时临床时序数据,对目标ICU患者的实时临床时序数据进行预处理,并输入至校准后的脓毒症预测模型中,输出且显示脓毒症发生风险预测结果。本发明无需人为干预,能够对ICU患者的脓毒症发生风险进行实时监测,以便为脓毒症的早期预警提供重要支持。

    一种结合功能函数和槽填充的大模型问答优化系统及方法

    公开(公告)号:CN119557410A

    公开(公告)日:2025-03-04

    申请号:CN202510122166.9

    申请日:2025-01-26

    Abstract: 本发明公开了一种结合功能函数和槽填充的大模型问答优化系统及方法,本发明通过槽位填充识别并填充查询中关键信息(如时间、地点、人物等)结合查询意图调用相应的功能函数或执行特定逻辑以完成任务,有效地解决现有大语言模型应用场景中经常出现的固执坚持己见、针对同一问题的多次提问反复做出同样的错误回答而无法理解用户意图的问题,使得大模型在处理用户提问时可以更准确地理解用户提问的意图,并更专业的调用功能函数回答用户的问题,可以在多轮问答中保持连贯性和一致性,提供更加流畅的用户体验,优化了整体的问答效果。

    一种基于知识图谱的肝癌术后复发风险的预测方法及装置

    公开(公告)号:CN114822852B

    公开(公告)日:2024-11-08

    申请号:CN202210552510.4

    申请日:2022-05-20

    Abstract: 本申请提出一种基于知识图谱的肝癌术后复发风险的预测方法及装置,属于医疗数据预测领域,其中方法包括:针对患者数据进行预处理,得到预处理后数据;针对所述预处理后数据,构建包含肝癌复发相关影响因素、肝癌指标和患者数据的知识图谱;采用XLNet训练模型对所述知识图谱中实体、关系进行训练,得到患者实体和关系的表征向量;根据所述患者实体和关系的表征向量,采用XGB算法进行预测,并用MSE作为损失函数,将损失函数最小的对应预测值,作为肝癌术后复发风险的预测值。系统包括:数据预处理模块、知识图谱构建模块、知识表征训练模块以及手术后复发风险预测模块。本申请提高了风险预测的可靠程度。

    基于人类反馈与强化学习的问答回复方法、系统及设备

    公开(公告)号:CN116955576B

    公开(公告)日:2024-07-02

    申请号:CN202311218911.7

    申请日:2023-09-21

    Abstract: 本发明涉及语言处理技术领域,特别提供一种基于人类反馈与强化学习的问答回复方法、系统及设备,该方法包括:基于目标数据,构造数据集,并基于数据集,对预训练模型进行继续预训练,得到初始问答模型;基于目标数据,构造三元组指令集数据;利用三元组指令集数据对初始问答模型进行优化,得到问答模型;基于目标数据,构造人类偏好指令集数据;基于人类偏好指令集数据,对问答模型进行训练,得到奖励模型;利用人类反馈强化学习机制,对奖励模型进行强化,得到问答回复模型,从而实现具备专业度较高的问答能力,以及具有回复人性化且专业准确性更高的特点。

    一种医学领域中的强化学习数据构建方法及系统

    公开(公告)号:CN117764204B

    公开(公告)日:2024-06-07

    申请号:CN202410191910.6

    申请日:2024-02-21

    Abstract: 本发明涉及医学数据构建技术领域,尤其涉及一种医学领域中的强化学习数据构建方法及系统;该方法包括:获取原始电子病例;对原始电子病例进行数据脱敏处理,得到脱敏数据集;对脱敏数据集进行实体标注和关系标注,构建状态集;构建预测集;对症状词语/症状关系词组与开源大模型答案进行人工校验,将正确的校验结果和对应的检查项价格进行标注,构建核对集;对检查项价格进行规整处理;构建强化学习数据集;基于该强化学习数据集,便于开展后续相关的强化学习,同时能够根据给定的病症或其它结果推荐价格较低的检查项目,以便为医生和患者在医学辅助诊断推荐决策中提供合适的推荐选择,降低医疗成本,提高医疗效果。

Patent Agency Ranking