-
公开(公告)号:CN119992636A
公开(公告)日:2025-05-13
申请号:CN202510116713.2
申请日:2025-01-24
Applicant: 北京交通大学
IPC: G06V40/18 , G06V40/16 , G06V10/46 , G06T7/80 , G06N5/04 , G06T3/067 , G06V10/75 , G06V10/44 , G06V10/82
Abstract: 本发明提供基于因果推断的个性化视线估计方法和系统,其中方法包括:通过标定获取相机的内部参数;对相机获取的图像进行人脸检测,获得人脸关键点;通过内部参数获取的头部姿势,计算获得相机的外部参数;通过内部参数和外部参数对图像进行归一化处理;将图像输入到基于因果推断的个性化视线估计模型进行处理,获得归一化相机坐标系下的三维视线方向;三维视线方向由俯仰角和偏航角表示;将三维视线方向的坐标转换为图像坐标系下的二维坐标。本发明针对视线估计任务中个性化信息导致的预测偏差,提出一种新颖的基于因果推断的方式,通过因果干预的方式提取每个图像的主体独立的外观特征,消除不相关的干扰个性化信息,提高视线估计模型对新用户的适应性。
-
公开(公告)号:CN119514629A
公开(公告)日:2025-02-25
申请号:CN202411575802.5
申请日:2024-11-06
Applicant: 北京交通大学
IPC: G06N3/08 , G06N3/047 , G06V10/764 , G06V10/44 , G06V10/82
Abstract: 本发明提供一种基于梯度变化差异的医学图像识别模型训练方法及系统,属于医学图像处理技术领域,获取训练数据;所述训练数据包括多个医学图像以及标注图像的标签;利用训练数据训练神经网络,得到所述医学图像识别模型;其中,计算训练过程中连续两个轮次之间的梯度变化差异,并以此来定义噪声标签学习的正则化损失函数。本发明没有增加模型的参数规模,训练成本和推理成本保持不变,确保了在不牺牲效率的前提下提升模型性能;能够有效降低噪声标签导致的假阳性,减少疾病辅助诊断中的误诊或漏诊,从而提高图像识别的准确性。
-