一种基于预训练语言模型的鲁棒的多模态主动学习方法

    公开(公告)号:CN115221947A

    公开(公告)日:2022-10-21

    申请号:CN202210727770.0

    申请日:2022-06-22

    Abstract: 本发明公开了一种基于预训练语言模型的鲁棒的多模态主动学习方法,采用两阶段的混合策略,首先在不确定性度量方面采用基于动量蒸馏的掩码语言损失作为不确定性代理,其继承了ALPS这类冷启动的主动学习策略将掩码语言损失作为度量标准的优点,从输入质量本身考虑样本的不确定性。同时充分考虑样本受具体下游任务的影响,提出一种动量蒸馏方法度量预训练损失在具体任务上的变化。此外针对主动选择策略容易受集体异常值影响的问题,采用了模型训练时预测的伪标签概率和其他标签概率的间距作为异常值指示器,并将这一异常值指示器的值作为聚类初始化选择的一个依据,从而在多样性聚类时减少了异常值的选择,提升了主动选择算法的鲁棒性。

    一种基于预训练语言模型的鲁棒的多模态主动学习方法

    公开(公告)号:CN115221947B

    公开(公告)日:2025-03-28

    申请号:CN202210727770.0

    申请日:2022-06-22

    Abstract: 本发明公开了一种基于预训练语言模型的鲁棒的多模态主动学习方法,采用两阶段的混合策略,首先在不确定性度量方面采用基于动量蒸馏的掩码语言损失作为不确定性代理,其继承了ALPS这类冷启动的主动学习策略将掩码语言损失作为度量标准的优点,从输入质量本身考虑样本的不确定性。同时充分考虑样本受具体下游任务的影响,提出一种动量蒸馏方法度量预训练损失在具体任务上的变化。此外针对主动选择策略容易受集体异常值影响的问题,采用了模型训练时预测的伪标签概率和其他标签概率的间距作为异常值指示器,并将这一异常值指示器的值作为聚类初始化选择的一个依据,从而在多样性聚类时减少了异常值的选择,提升了主动选择算法的鲁棒性。

Patent Agency Ranking