arxiv_cs_lg 2026年2月10日

FIRE: 平衡安定性と可塑性に関するフランクニスの等距再初期化

FIRE: Frobenius-Isometry Reinitialization for Balancing the Stability-Plasticity Tradeoff

Translated: 2026/3/15 15:01:11

continual-learningdeep-neural-networksreinitializationstability-plasticity-tradeoffreinforcement-learning

Japanese Translation

arXiv:2602.08040v1 Announce Type: new Abstract: 定常ではないデータに訓練された深層ニューラルネットワークは、安定性（以前の知識の保持）と可塑性（新しいタスクへの適応）をバランスさせる必要があります。標準的な再初期化方法（重み値を元の値に再初期化するもの）は広く使用されていますが、チューニングが困難であり、保守的な再初期化は可塑性の回復に失敗し、過激な再初期化は有用な知識を消去してしまいます。安定と可塑性のトレードオフを明確にバランスさせる原理的な再初期化方法である FIRE を提案します。FIRE は、Squared Frobenius Error (SFE) を通じて安定性を、Deviation from Isometry (DfI) を通じて可塑性を定量化します。SFE は過去の重みとの近接度を、DfI は重みの等方性を表します。再初期化点は、DfI が 0 となるように SFE を最小化する制約付き最適化問題を用いて得られます。これはニュートン・シューツ反復により効率的に近似されます。FIRE は、連続視覚学習（CIFAR-10 と ResNet-18）、言語モデル（OpenWebText と GPT-0.1B）、強化学習（HumanoidBench と SAC、Atari ゲームと DQN）において、すべての分野で単純なトレーニングおよび標準的な再初期化方法と比較して一貫して卓越した結果を示し、安定と可塑性のトレードオフの効果的なバランスを実証しています。

Original Content

arXiv:2602.08040v1 Announce Type: new Abstract: Deep neural networks trained on nonstationary data must balance stability (i.e., retaining prior knowledge) and plasticity (i.e., adapting to new tasks). Standard reinitialization methods, which reinitialize weights toward their original values, are widely used but difficult to tune: conservative reinitializations fail to restore plasticity, while aggressive ones erase useful knowledge. We propose FIRE, a principled reinitialization method that explicitly balances the stability-plasticity tradeoff. FIRE quantifies stability through Squared Frobenius Error (SFE), measuring proximity to past weights, and plasticity through Deviation from Isometry (DfI), reflecting weight isotropy. The reinitialization point is obtained by solving a constrained optimization problem, minimizing SFE subject to DfI being zero, which is efficiently approximated by Newton-Schulz iteration. FIRE is evaluated on continual visual learning (CIFAR-10 with ResNet-18), language modeling (OpenWebText with GPT-0.1B), and reinforcement learning (HumanoidBench with SAC and Atari games with DQN). Across all domains, FIRE consistently outperforms both naive training without intervention and standard reinitialization methods, demonstrating effective balancing of the stability-plasticity tradeoff.