-
公开(公告)号:CN119153017A
公开(公告)日:2024-12-17
申请号:CN202411596703.5
申请日:2024-11-11
Applicant: 之江实验室
IPC: G16H15/00 , G16H10/60 , G16H30/40 , G06F16/58 , G06F18/213 , G06F40/126 , G06V10/32 , G06V10/74 , G06V10/82 , G06N3/045
Abstract: 本发明公开了一种基于多模态语言对齐的数据增强方法和装置,该方法包括:采集电子病历系统中患者的基本信息、观察窗期间的诊断报告和各类图像数据,并对其进行预处理;分别对预处理后的图像和诊断报告进行图像数据编码和文本数据编码,得到编码后的图像嵌入表示和文本嵌入表示;将编码后的图像嵌入表示和文本嵌入表示进行模态投影融合,通过对比学习方法构建其损失函数,通过最小化对比学习的损失函数对齐图像嵌入表示和文本嵌入表示;通过基于语言相似性的图像‑文本对生成的解码方法,生成图像‑文本对数据。本发明能够区分图像和文本以及不同模态的图像;还可以生成指定模态的数据,解决了多模态大模型研究中缺少数据量的问题。
-
公开(公告)号:CN115661550B
公开(公告)日:2023-05-30
申请号:CN202211461517.1
申请日:2022-11-17
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/094
-
公开(公告)号:CN115661550A
公开(公告)日:2023-01-31
申请号:CN202211461517.1
申请日:2022-11-17
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/094
Abstract: 本发明公开了基于生成对抗网络的图数据类别不平衡分类方法及装置,通过构建生成器,将属性图信息输入到生成器中,生成器包括低阶神经网络和高阶神经网络,学习图的局部和全局信息,学习并得到节点的嵌入表示向量;再对少样本图数据进行过采样,根据合成少数类过采样技术SMOTE原则,对学习到的每个少数类表示向量进行近邻计算,选择其最近邻节点进行插值计算,生成新的节点;然后重建平衡图数据,通过已有图的节点和边信息训练边生成器,对生成的节点进行链路预测;最后将重建的平衡图数据作为判别器的输入,进行节点分类。有效解决了数据不平衡的假阳性问题,提高了图的节点分类准确率。
-
公开(公告)号:CN115344607A
公开(公告)日:2022-11-15
申请号:CN202210933381.3
申请日:2022-08-04
Applicant: 之江实验室
IPC: G06F16/2453 , G06F16/2455 , G06F9/50 , G06F16/901
Abstract: 本发明属于图数据挖掘领域,公开了一种面向图数据的批量流式边点混合切分方法,设计了一种基于点流数据的批量划分策略,提出了一种优化负载和通讯代价的目标函数,通过计算目标函数确定批量流数据的初始点切分。同时,本方法通过计算现有切分和将流数据节点的分身节点加入到次有切分后的切分增益,决定是否保留分身。除此之外,本发明既解决了点划分的信息丢失,又避免了边切分的信息冗余,在进行点切分和边切分时,都可以并行处理。
-
公开(公告)号:CN115329166A
公开(公告)日:2022-11-11
申请号:CN202210851507.2
申请日:2022-07-19
Applicant: 之江实验室
IPC: G06F16/906 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种多元异步时序数据分类方法,提出了一种新颖的时间感知双注意力和记忆增强网络,通过将注意和记忆结合起来,有效地模拟不规则、异步、稀疏采样的多元异步时间序列数据中复杂的相互作用,并设计了随机生成插补模块,构建一个双任务学习体系,实现缺失值插补和分类网络的协同统一。本发明在对异步时序数据缺失值插补和分类的过程中,能够有效挖掘数据隐含的相关性,挖掘有意义的潜在语义,并充分利用序列数据中的辅助信息,从未标记的数据中发现有意义的模式。同时考虑异步时序数据缺失值插补和分类两个任务之间的相互作用,有助于缓解误差传播问题,捕捉相互影响,提高模型的准确性。
-
公开(公告)号:CN115146708A
公开(公告)日:2022-10-04
申请号:CN202210641407.7
申请日:2022-06-08
Applicant: 之江实验室
Abstract: 本发明属于数据挖掘异常检测技术领域,公开了一种基于生成式对抗主动学习的离群点检测方法,该方法步骤为:S1、输入数据;S2、训练生成模型并生成样本;S3、训练主动学习分类模型并筛选生成样本;S4、训练判别模型;S5、执行异常检测操作。本发明针对异常检测中常见的数据样本标签数量有限和正负样本不均匀分布等问题,采用基于生成式对抗主动学习的技术方法,生成多样的、信息丰富的、有代表性的样本,实现更准确的离群点检测。
-
公开(公告)号:CN114943019A
公开(公告)日:2022-08-26
申请号:CN202210448476.6
申请日:2022-04-27
Applicant: 之江实验室
IPC: G06F16/903 , G06F16/901
Abstract: 本发明属于图数据挖掘技术领域,公开了一种基于双层权重网络随机游走的top 非重叠多样化社区发现方法,包括如下步骤:步骤一:属性图数据、参数输入;步骤二:构造结构紧密性权重网络;步骤三:构造属性多样化增益权重网络;步骤四:基于双层权重网络的标签传播;步骤五:计算多样化社区度量,排序输出前个结果。本发明通过在原属性图基础上构造紧密度权重网络和属性多样化增益权重网络,实现在社区挖掘的过程中同时使用结构紧密和属性多样化双重约束。本方法在设计辅助网络权重时,通过引入几个超参数,使得算法具有灵活性和泛化性,可以根据实际应用的需要来调节属性约束和结构约束所占的比重。
-
公开(公告)号:CN113658716A
公开(公告)日:2021-11-16
申请号:CN202110851425.3
申请日:2021-07-27
Applicant: 之江实验室
IPC: G16H50/80 , G06F16/215 , G06F16/26 , G06F16/29
Abstract: 本发明属于公共卫生服务技术领域,具体涉及一种基于约束子图计算的新冠肺炎感染人群分析方法及系统,该方法步骤为:S1、新冠数据收集与清洗;S2、构建新冠肺炎场景下的人群图模型;S3、分析计算人群被感染概率指数;S4、发现潜在的感染人群并输出。本发明采用约束子图计算挖掘技术,综合多方面感染因素,通过定义计算被感染概率指数的方法,更有效的挖掘出潜在的新冠肺炎感染人群;基于被感染概率指数指标,设计新冠肺炎感染人群分析系统,设定不同级别的防疫应对举措,精确通知到管理部门和个体人群,为公共卫生防疫工作提供极大的助力,降低新冠感染概率,保护公众生命安全。
-
公开(公告)号:CN117012375A
公开(公告)日:2023-11-07
申请号:CN202311284104.5
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本发明公开了一种基于患者拓扑特征相似性的临床决策支持方法和系统,该方法包括:采集患者的电子健康记录数据;对电子健康记录数据进行预处理,得到标准化的每个患者的诊疗事件;根据每个患者的诊疗事件以及医疗知识图谱构建患者的异构图;通过一阶共有邻居计算患者之间的一阶相似性,通过异构元路径挖掘患者间的高阶相似性,融合两种相似性得到患者间的相似度;对相似度排序得到M个相似度最高的患者,根据该M个患者的电子健康记录数据进行临床分析,得到分析结果为医生设计治疗方案提供指导。本发明不需要专家知识库,可以兼容不同的医疗领域,同时避免了长时间训练和黑盒特性,有利于节省时间成本,有助于增强泛化能力和可解释性。
-
公开(公告)号:CN117009839A
公开(公告)日:2023-11-07
申请号:CN202311267386.8
申请日:2023-09-28
Applicant: 之江实验室
Abstract: 本申请涉及一种基于异构超图神经网络的患者聚类方法和装置,其中,该基于异构超图神经网络的患者聚类方法包括:根据各个对象的电子病历信息,构建与对象对应的异构超图;将目标模型中表示学习模块对应的重构损失函数,以及目标模型中对象聚类模块对应的聚类损失函数作为模型整体损失,对目标模型进行训练,直至目标模型收敛,输出对象聚类模块中的最终聚类结果;其中,在目标模型的训练过程中,基于每次表示学习模块从异构超图中学习到的节点表示矢量,更新对象聚类模块中的聚类结果;节点表示矢量为异构超图中每个对象的就诊记录节点对应的表示矢量。通过本申请,解决了无法获取准确的聚类结果的问题,实现了提高聚类结果的准确性。
-
-
-
-
-
-
-
-
-