.@AnkythShukla fez uma afirmação ousada no podcast: "Melhores que desenvolvedores, melhores que designers, melhores que o CEO e os empresários, os PMs estão fundamentalmente posicionados em uma posição em que deveriam ser os donos das avaliações. Eles têm o conhecimento do negócio, do cliente e da tecnologia." Este é um argumento estrutural, não uma opinião. Veja por que isso importa: > Engenheiros entendem o modelo. Eles não entendem a definição de "bom resultado" do cliente. > Designers entendem a experiência. Eles não compreendem as restrições técnicas dos sistemas não determinísticos. > Líderes empresariais entendem o retorno sobre o investimento. Eles não entendem o que é um juiz de LLM ou como calibrá-lo. > O Primeiro-Ministro está sentado na interseção dos três. É exatamente isso que as avaliações de IA exigem – alguém que consiga traduzir os requisitos de negócio em critérios mensuráveis e, em seguida, validar que a IA realmente os atende em produção. Avaliações de IA não são testes de QA rebatizados. É uma disciplina fundamentalmente nova. E os PMs são os donos naturais. O episódio completo detalha as métricas, ferramentas e frameworks de juízes de LLM passo a passo.