ANCL
Auxiliary Network Continual Learning (ANCL)
Paper: Achieving a Better Stability-Plasticity Trade-off via Auxiliary Networks in Continual Learning
Authors: Sanghwan Kim ; Lorenzo Noci ; Antonio Orvieto ; Thomas Hofmann
Code: https://github.com/kim-sanghwan/ANCL
Framework:
Continual Learning (CL) 持续学习
符号定义
- PT:Previous Task
- CT:Current Task
含义
保留 PT 信息的同时,继续在 CT 中进行学习
难点:Catastrophic Forgetting 灾难性的遗忘
对于梯度更新学习的模型,在学习 CT 的过程中更倾向于覆盖 PT 学习的梯度
换而言之,Stability-Plasticity Dilemma
Martial Mermillod, Aur ́ elia Bugaiska, and Patrick Bonin. The stability-plasticity dilemma: Investigating the continuum from catastrophic forgetting to age-limited learning effects, 2013. 1
- Stability: 在 PT 具有较好的泛化能力
- Plasticity: 在 CT 学习新概念
所以,如何平衡 Stability 和 Plasticity是研究的重点
任务分类
- Task Incremental Learning (TIL):训练和测试阶段均为模型提供当前任务标识
- Domain Incremental Learning (DIL):测试阶段不提供当前任务标识
- Class Incremental Learning (CIL):测试阶段自动识别当前任务标识和分类
学习难度逐渐增加,ANCL 在 TIL 和 CIL 设置中进行了评估
相关工作
增加 Auxiliary Network 或 Extra Module
Active Forgetting with synaptic Expansion-Convergence (AFEC) 超参控制新旧参数的融合
当前工作
框架化使用 Auxiliary Network 的 CL,使得 Auxiliary Network 插件化
通过
局限
- 不同方法依赖于不同的超参