- El modelo de OpenAI resolvió todos los 12 de 12 problemas en las Finales Mundiales de ICPC. - El Gemini 2.5 Deep Think de Google resolvió 10/12. - El mejor equipo humano obtuvo 11/12. GPT-5 también resolvió 11/12, y un modelo experimental de razonamiento resolvió el problema más difícil. La programación competitiva es bastante diferente de construir sistemas a gran escala o escribir código de producción. Me encantaría ver más benchmarks que reflejen tareas de ingeniería de software del mundo real.