一种基于标注可靠性的众包数据真值推断方法

    公开(公告)号:CN116912615A

    公开(公告)日:2023-10-20

    申请号:CN202310665167.9

    申请日:2023-06-05

    Abstract: 本发明涉及机器学习领域,具体涉及一种基于标注可靠性的众包数据真值推断方法。该方法构建众包数据真值判断模型对众包数据的真值进行判断,众包数据真值判断模型的构建基于现有端到端真值推断范式,采用分类器训练和混淆矩阵建模标注者的模式,使用的标注做了软标签处理,通过建模标注者能力和从任务特征提取难度,利用神经网络进行认知诊断流程,获得标注者对任务的标注可靠性,再利用标注可靠性构建软标签用于训练。本发明采用基于标注可靠性的真值推断方法(CrowdAR)来对建模标注者的混淆矩阵,同时建模不同标注者的标注可靠性,进而提高众包数据真值推断的准确性,同时进一步提高真值推断结果的可靠性。

Patent Agency Ranking