Acabei de ouvir uma análise da transição da Gemini de 2.0 para 2.5, e aqui está o resumo. A equipe não se baseou apenas em testes de laboratório. Eles coletaram feedback real de usuários no X, transformaram aqueles momentos de "isso quebrou" em avaliações vivas e continuam adicionando novos casos extremos a cada lançamento. É um ciclo de QA impulsionado pela comunidade: nossas falhas tornam-se seus benchmarks, que se tornam nossos melhores resultados. Se você é um criador ou PM, este é um modelo: feedback público → avaliações → lançamento → repetir. Ótimo trabalho @OfficialLoganK @nbrichtova e toda a equipe.
59,98K