Usuarioinput
Explica en 5 puntos cómo funciona la auto-atención y agrega un ejemplo simple.
Asistenteoutput (simulado)
Listo cuando ejecutes. Voy a simular: tokenización → embeddings → N capas → logits → muestreo → texto.
Cada paso se conecta con el siguiente y se resaltan rutas: Input → Attention → Output. Durante la ejecución, la línea cambia a azul y luego a verde.