Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hoy en día, el Vibe Coding no es tan maravilloso.
El Vibe Coding que imaginamos debería ser así: das una tarea, la IA piensa y luego te hace algunas preguntas clave, y después comienza a trabajar durante un largo tiempo. En ese momento, puedes relajarte, tomar un refresco con gas, ver videos cortos y disfrutar de la vida.
Pero ahora, después de que das una tarea, debido a que no explicaste un detalle, la IA pasa 30 minutos pensando y genera algo que está a años luz de lo que querías. Te enojas y haces un rollback, luego, conteniendo tu ira, le explicas en el prompt lo que necesita tener en cuenta, cómo debería hacerlo, y le pides que continúe generando. Después de otros 30 minutos, te dice que solo escuchó una parte de lo que dijiste y sigue generando una tarta de fresas. Como solo complementaste una parte del prompt, en otro lugar sigue generando muchas tartas de fresas. En este punto, señalas su error con furia, y él dice: "Finalmente lo entiendo", y continúa generando caca. Después de una larga lucha, finalmente te rindes y comienzas a buscar el problema en el código, pasas 30 minutos viendo el código que genera y cada vez te enojas más, sintiendo que es como si un pasante hubiera copiado un poco de aquí y de allá de internet y lo hubiera juntado en un montón de basura. Al final, te enojas y refactorizas el código. Esta situación es más evidente en proyectos más complejos (por ejemplo, aquellos que involucran múltiples microservicios, interacción entre frontend y backend, comunicación de middleware, etc.).
Entonces comienzas a dudar de ti mismo, ¿por qué otros pueden usar la IA para completar tantos proyectos interesantes mientras que el código que me genera la IA es una porquería? Después de múltiples luchas, te atreves a buscar información sobre cómo interactuar correctamente con la IA, y tras lo que crees que has encontrado, continúas comunicándote con la IA, pero el resultado sigue siendo un montón de caca. El tiempo se desperdicia en esto.
Hubo un tiempo en que Claude Code, como el rey del Vibe Coding, abrió un nuevo camino, en realidad, mejorando la efectividad a través de múltiples ejecuciones para aumentar la tasa de aciertos. Supongamos que el contenido generado por la IA tiene solo un 80% de precisión, entonces Claude Code, a través de múltiples autoevaluaciones, análisis y modificaciones, puede aumentar la precisión al 99%, generando así un código muy bueno. Pero Claude Code, al igual que Cursor, ha sufrido diversas limitaciones y restricciones, lo que ha llevado a que la tasa de aciertos, que originalmente no era alta, disminuya rápidamente. Originalmente, se podía alcanzar un 99% de precisión con 4 correcciones, pero después de las limitaciones, si la tasa de aciertos es solo del 70%, necesitará 6 correcciones para alcanzar el mismo resultado que antes. Además, Claude ha impuesto límites en el uso, lo que significa que ahora no se puede generar código efectivo en el mismo tiempo, incluso si se alcanza el límite, no funcionará.
Y ahora, ¿por qué Codex es tan elogiado? La razón principal es que le gusta preguntar la opinión de los usuarios, pregunta si hay problemas con mi propuesta, si se puede hacer de esta manera, y te ofrece varias opciones sobre cómo mejorar y cómo implementarlo. Esto es genial, porque la IA comete errores, y en realidad, tus respuestas ayudan a llenar los vacíos en la tasa de aciertos, permitiendo que genere contenido con una precisión cercana al 99% en una sola vez.
Claude Code es un gran producto, pero se está volviendo cada vez peor porque su tasa de aciertos no alcanza la altura que la gente desea. La IA es, en esencia, un gran generador de coincidencias probabilísticas, y la clave para su rendimiento radica en que la salida de probabilidades se acerque lo más posible a 1. En ingeniería, simplemente se utilizan diversas estrategias para hacer que se acerque a 1. Sin embargo, las limitaciones y la reducción de inteligencia hacen que sea cada vez más difícil acercarse a 1.
Por otro lado, Codex sabe que la IA pura no es confiable, por lo que delega la tarea de corrección a los usuarios, transformándose de una herramienta de Vibe Coding en un asistente de IA, y el resultado es bastante bueno.
Estas herramientas de IA también necesitan reflexionar sobre cómo resolver estos problemas en caso de que la tasa de aciertos sea insuficiente. La respuesta que da Codex es bastante buena, pero ¿es la solución óptima? No necesariamente, aunque personalmente creo que la colaboración entre múltiples agentes sigue siendo efectiva. Dado que cada IA tiene su propio método de coincidencia y generación de resultados, la validación cruzada entre múltiples agentes y el pensamiento paralelo es la mejor fórmula.
Sin embargo, esto definitivamente no puede ocurrir en estas empresas de modelos de IA, porque seguramente están obligadas a usar sus propios modelos, por lo tanto, los terceros son la mejor opción para hacer esto. (No tengo más que decir, solo digo lo que pienso.)
Parte superior
Clasificación
Favoritos