.@AnkythShukla hizo una afirmación audaz en el podcast: "Mejor que los desarrolladores, mejor que los diseñadores, mejor que el CEO y los empresarios, los PMs están fundamentalmente en una posición que deberían ser los responsables de las evaluaciones. Tienen el conocimiento del negocio, del cliente y de la tecnología." Este es un argumento estructural, no una opinión. Aquí está por qué es importante: > Los ingenieros entienden el modelo. No entienden la definición del cliente de "buen resultado." > Los diseñadores entienden la experiencia. No entienden las limitaciones técnicas de los sistemas no deterministas. > Los líderes empresariales entienden el ROI. No entienden qué es un juez de LLM o cómo calibrarlo. > El PM se sienta en la intersección de los tres. Eso es exactamente lo que exigen las evaluaciones de IA: alguien que pueda traducir los requisitos comerciales en criterios de evaluación medibles, y luego validar que la IA realmente los cumple en producción. Las evaluaciones de IA no son pruebas de QA renombradas. Es una disciplina fundamentalmente nueva. Y los PMs son los propietarios naturales. El episodio completo desglosa las métricas exactas, herramientas y marcos de jueces de LLM paso a paso.