.@AnkythShukla hizo una afirmación audaz en el podcast: "Mejores que los desarrolladores, mejores que los diseñadores, mejores que el CEO y los empresarios, los PM están fundamentalmente en una posición en la que deberían ser los dueños de las evaluaciones. Tienen el conocimiento del negocio, del cliente y de la tecnología." Esto es un argumento estructural, no una opinión. Aquí está por qué importa: > Ingenieros entienden el modelo. No entienden la definición de "buen rendimiento" que tiene el cliente. > Los diseñadores entienden la experiencia. No comprenden las limitaciones técnicas de los sistemas no deterministas. > Los líderes empresariales entienden el retorno de la inversión (ROI). No entienden qué es un juez de LLM ni cómo calibrarlo. > El Primer Ministro se sienta en la intersección de los tres. Eso es exactamente lo que exigen las evaluaciones de IA: alguien que pueda traducir los requisitos empresariales en criterios de evaluación medibles, y luego validar que la IA realmente los cumple en producción. Las evaluaciones de IA no son pruebas de QA renombradas. Es una disciplina fundamentalmente nueva. Y los PM son los dueños naturales. El episodio completo desglosa paso a paso las métricas exactas, herramientas y marcos de jueces de LLM.