Acabo de escuchar un análisis del salto de Gemini de 2.0 a 2.5, y aquí está la esencia. El equipo no se basó solo en pruebas de laboratorio. Recopilaron comentarios reales de usuarios de X, convirtieron esos momentos de "esto se rompió" en evaluaciones vivas, y siguen añadiendo nuevos casos extremos con cada lanzamiento. Es un bucle de QA impulsado por la comunidad: nuestros fracasos se convierten en sus puntos de referencia, que se convierten en nuestros mejores resultados. Si eres un creador o PM, este es un modelo: comentarios públicos → evaluaciones → lanzamiento → repetir. Gran trabajo @OfficialLoganK @nbrichtova y todo el equipo.
60,66K