数据管理方法、装置、计算机设备和存储介质

    公开(公告)号:CN116975036A

    公开(公告)日:2023-10-31

    申请号:CN202310996476.4

    申请日:2023-08-09

    Applicant: 北京大学

    Abstract: 本申请涉及一种数据管理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:接收代理服务器提交的质控规则以及质控数据集;质控数据集为代理服务器基于数据的键值对数据形式在通用数据表中查询得到的,通用数据表中包含数据库中的全量数据;对质控数据集中的各质控数据进行解析,并基于解析出的具有相同域信息的质控数据构建质控数据表;在各质控数据表中查询满足质控规则的目标数据,得到目标数据集,并将目标数据集反馈给代理服务器;目标数据集用于确定并修复异常数据。采用本方法能够提高数据管理效率。

    医学不良事件文本分类方法、装置、电子设备及介质

    公开(公告)号:CN114996461B

    公开(公告)日:2023-01-06

    申请号:CN202210839075.3

    申请日:2022-07-18

    Applicant: 北京大学

    Abstract: 本发明提供一种医学不良事件文本分类方法、装置、电子设备及介质,属于深度学习技术领域。所述方法包括:构建文本分类模型,所述文本分类模型包括:深度金字塔卷积神经网络、循环卷积神经网络和分类层,所述分类层用于基于所述深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果进行分类;将医学不良事件文本输入所述文本分类模型,经过所述文本分类模型处理后,获得医学不良事件文本分类结果。本发明构建的文本分类模型融合了深度金字塔卷积神经网络和循环卷积神经网络,可以基于深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果对医学不良事件文本进行有效分类。

    量表问题生成模型的训练方法、装置和计算机设备

    公开(公告)号:CN114417794A

    公开(公告)日:2022-04-29

    申请号:CN202210315507.0

    申请日:2022-03-29

    Applicant: 北京大学

    Abstract: 本申请涉及一种量表问题生成模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取目标临床量表数据集;针对每一个临床量表语句对,在预设的多种文本破坏方式中,确定临床量表语句对对应的文本破坏方式;多种文本破坏方式包括疑问词插入;根据临床量表语句对对应的文本破坏方式,对临床量表语句对中的目标临床量表语句进行文本破坏处理,得到目标临床量表语句对应的破坏临床量表语句;根据各临床量表语句对、以及各目标临床量表语句对应的破坏临床量表语句,构成量表语料训练数据集;采用量表语料训练数据集,对目标模型进行模型训练,得到量表问题生成模型。采用本方法能够自动生成量表问题,提高效率。

    聚类方法、装置、计算机设备和存储介质

    公开(公告)号:CN118094273B

    公开(公告)日:2025-03-21

    申请号:CN202410078590.3

    申请日:2024-01-19

    Applicant: 北京大学

    Abstract: 本申请涉及一种聚类方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待聚类数据包括的多个样本以及各样本的目标权重;通过距离聚类算法以及各样本的目标权重,对多个样本进行聚类,得到第一聚类结果;确定第一聚类结果对应的区分参数,以及确定各簇分别对应的线性判别参数;基于各簇分别对应的线性判别参数对各样本的目标权重进行更新,基于更新后的目标权重,得到目标聚类结果。通过采用本方法,可以避免对数据进行压缩,保留数据的完整信息,通过加权距离以及实时更新的权重实现数据的聚类,提高了聚类的可靠性,通过动态迭代的方式实时对样本的权重进行更新,可以更好地适应动态变化的聚类过程,提升聚类效率。

    图像数据处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN118038080A

    公开(公告)日:2024-05-14

    申请号:CN202410125078.X

    申请日:2024-01-30

    Applicant: 北京大学

    Abstract: 本申请涉及一种图像数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取图像训练集,并基于编码器提取图像训练集中的图像结构特征和图像纹理特征;对图像结构特征和图像纹理特征进行重构,得到重构图像特征,并通过共享解码器对重构图像特征进行解码处理,得到重构损失值集;通过分类器对图像结构特征进行分类处理,得到分类损失值集,并基于重构损失值集和分类损失集更新编码器和共享解码器的参数;在更新后的编码器满足训练停止条件的情况下,将编码器中的共享编码器确定为特征提取模型;特征提取模型用于提取图像中的图像结构特征。采用本方法能够提高特征提取模型的准确性。

    质量特征提取方法、装置、计算机设备和存储介质

    公开(公告)号:CN117409211A

    公开(公告)日:2024-01-16

    申请号:CN202311419589.4

    申请日:2023-10-30

    Applicant: 北京大学

    Inventor: 黄雨 楼轶维

    Abstract: 本申请涉及一种质量特征提取方法、装置、计算机设备和存储介质。所述方法包括:将目标图像输入至目标保真特征提取模型中,得到目标图像的目标保真特征,并将目标图像输入至目标结构特征提取模型中,得到目标图像的目标结构特征;将目标保真特征和目标结构特征进行拼接处理,得到目标图像的质量特征;其中,目标保真特征提取模型是基于多个样本失真图像训练得到的,目标结构特征提取模型是基于多个样本失真图像和各样本失真图像对应的相似测度训练得到的。采用本方法能够使得提取到的目标保真特征和目标结构特征更加准确,进一步使得目标图像的质量特征更加准确,从而使得后续基于质量特征对目标图像进行质量评估时更加精准。

    医学不良事件文本分类方法、装置、电子设备及介质

    公开(公告)号:CN114996461A

    公开(公告)日:2022-09-02

    申请号:CN202210839075.3

    申请日:2022-07-18

    Applicant: 北京大学

    Abstract: 本发明提供一种医学不良事件文本分类方法、装置、电子设备及介质,属于深度学习技术领域。所述方法包括:构建文本分类模型,所述文本分类模型包括:深度金字塔卷积神经网络、循环卷积神经网络和分类层,所述分类层用于基于所述深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果进行分类;将医学不良事件文本输入所述文本分类模型,经过所述文本分类模型处理后,获得医学不良事件文本分类结果。本发明构建的文本分类模型融合了深度金字塔卷积神经网络和循环卷积神经网络,可以基于深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果对医学不良事件文本进行有效分类。

    医疗数据处理方法、装置、设备及存储介质

    公开(公告)号:CN119580903A

    公开(公告)日:2025-03-07

    申请号:CN202411870925.1

    申请日:2024-12-18

    Abstract: 本发明公开了一种医疗数据处理方法、装置、设备及存储介质,该方法包括:获取医疗队列数据,并对医疗队列数据进行数据预处理,获得待处理数据;基于待处理数据,利用预设工作流引擎的可视化工具和工作流描述语言生成医疗数据分析工作流;根据各计算节点的负载情况和医疗数据分析工作流的特征将医疗数据分析工作流拆分为多个子任务,并将各子任务分配至不同的计算节点;实时监控各计算节点中子任务的执行状态,直至完成所有子任务后输出医疗数据分析结果。由于本发明根据各计算节点的负载情况和医疗数据分析工作流的特征将医疗数据分析工作流进行拆分,并将各子任务分配至不同的计算节点,提升了对医疗队列数据分析的资源调度和数据处理的效率。

    量表问题生成模型的训练方法、装置和计算机设备

    公开(公告)号:CN114417794B

    公开(公告)日:2022-09-09

    申请号:CN202210315507.0

    申请日:2022-03-29

    Applicant: 北京大学

    Abstract: 本申请涉及一种量表问题生成模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取目标临床量表数据集;针对每一个临床量表语句对,在预设的多种文本破坏方式中,确定临床量表语句对对应的文本破坏方式;多种文本破坏方式包括疑问词插入;根据临床量表语句对对应的文本破坏方式,对临床量表语句对中的目标临床量表语句进行文本破坏处理,得到目标临床量表语句对应的破坏临床量表语句;根据各临床量表语句对、以及各目标临床量表语句对应的破坏临床量表语句,构成量表语料训练数据集;采用量表语料训练数据集,对目标模型进行模型训练,得到量表问题生成模型。采用本方法能够自动生成量表问题,提高效率。

    检验报告生成模型的训练方法及装置、检验报告生成方法

    公开(公告)号:CN117649917B

    公开(公告)日:2024-06-28

    申请号:CN202410116272.1

    申请日:2024-01-29

    Applicant: 北京大学

    Abstract: 本申请涉及一种检验报告生成模型的训练方法及装置、检验报告生成方法。初始检验报告生成模型包括特征提取模块及特征融合模块,所述方法包括:获取样本检验图像,从检验报告先验知识图谱中确定样本检验图像对应的目标子图;通过特征提取模块分别对样本检验图像及目标子图进行特征提取处理,得到样本检验图像的图像特征、及目标子图的图谱特征;通过特征融合模块对图像特征及图谱特征进行融合处理,得到融合特征;根据融合特征生成目标检验报告,并根据样本检验图像对应的样本检验报告与目标检验报告之间的差异,对初始检验报告生成模型进行训练,得到训练好的检验报告生成模型。采用本方法能够提高检验报告的生成精度。

Patent Agency Ranking