Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers

ArXi:2605.30049v1 Announce Type: new Diffusion Transformers have become a powerful backbone for text-to-image generation, but their layered and cross-modal generation process makes safety control fundamentally different from prompt-level filtering or output-level detection. Harmful semantics may be weakly expressed in text representations, progressively bound to visual latents, and finally entangled with rendering dynamics.