Meta-Learning for Semi-Supervised Few-Shot Classification

Posted on 2025-10-16 In Paper Word count in article: 1k Reading time ≈ 4 mins.

这篇论文《Meta-Learning for Semi-Supervised Few-Shot Classification》（Ren 等，2018）提出了一种半监督小样本分类的元学习方法，扩展了传统的小样本学习框架，使其能够利用未标记样本来提升分类性能。以下是对论文的详细解读：

一、研究背景与动机

1. 小样本学习

目标：从极少量标记样本中学习分类器。
常用方法：元学习，通过在多个“任务”或“情节”上训练模型，使其能够快速适应新任务。

2. 现有局限

传统小样本学习仅使用标记样本，忽略了现实中大量存在的未标记数据。
人类在学习新概念时，往往同时利用标记和未标记信息。

3. 本文贡献

提出半监督小样本学习 新范式，每个情节中包含：
- 标记样本（支持集）
- 未标记样本（可能包含目标类或干扰类）
提出三种扩展原型网络 的方法，以利用未标记数据。
构建新数据集 tieredImageNet，具有层次结构，更贴近现实。

二、方法：半监督原型网络

1. 原型网络回顾

每个类的原型为该类嵌入向量的均值： [ _c = ]
分类基于查询样本与各原型的距离。

2. 三种半监督扩展方法

（1）Soft k-Means

将未标记样本以软分配方式加入原型计算： [ _c = ]
其中 (_{j,c}) 是样本对类 (c) 的软分配权重。

（2）Soft k-Means with a Distractor Cluster

引入一个“干扰簇”来捕获不属于任何目标类的样本，防止其污染原型。
干扰簇原型设为原点，并学习其尺度参数 (r_{N+1})。

（3）Masked Soft k-Means

使用一个可学习的掩码机制，动态决定每个未标记样本对每个原型的贡献： [ m_{j,c} = (-c ({j,c} - _c)) ]
其中 (_c, _c) 由一个小型MLP根据距离统计量预测。

三、实验设计与数据集

1. 数据集

Omniglot：手写字符，1,623类。
miniImageNet：100类，每类600张图像。
tieredImageNet（本文提出）：
- 608类，34个高级类别。
- 训练/验证/测试类别来自不同高级类别，更具挑战性。

2. 半监督设置

将每类图像划分为：
- 标记部分（10% 或 40%）
- 未标记部分（90% 或 60%）
在情节中引入未标记样本，部分情节中还加入干扰类样本。

3. 基线模型

Supervised：标准原型网络。
Semi-Supervised Inference：仅在测试时使用软k均值。

四、实验结果

主要结论：

所有提出的半监督模型在有无干扰类的情况下均优于纯监督基线。
Masked Soft k-Means 在干扰类存在时表现最稳健。
随着未标记样本数量增加，模型性能提升，说明模型学会了利用未标记数据。
在 tieredImageNet 上表现尤其显著，说明该方法在更具挑战性的数据集上有效。

五、贡献总结

问题定义：首次系统研究半监督小样本学习，包括干扰类场景。
方法提出：三种基于原型网络的半监督扩展方法。
数据集构建：提出 tieredImageNet，具有层次结构和更清晰的训练/测试划分。
实验验证：在多个数据集上验证了方法的有效性，尤其是在干扰类存在时的鲁棒性。

六、未来方向

引入快速权重机制，使嵌入函数能根据情节内容动态调整。
探索更复杂的半监督和聚类机制。
在更大规模或更具挑战性的数据集上验证方法。

如果有需要修改或者补充的地方，可以随时告诉我。