AI RESEARCH

Robust Reasoning via Dynamic Token Selection for Distribution-Aligned Self-Distillation

arXiv CS.CL • June 02, 2026

ArXi:2606.00628v1 Announce Type: new Self-distillation improves learning efficiency by rewriting reference answers as