Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Сегодня Vibe Coding не так хорош, как кажется.
Представлялось, что Vibe Coding должен быть таким: вы даете задачу, AI обдумывает ее и задает вам несколько ключевых вопросов, а затем начинает долго работать над ней, в то время как вы можете расслабиться, выпить газированную воду, посмотреть короткие видео и насладиться жизнью.
А сейчас, после того как вы даете задачу, из-за того, что вы не объяснили что-то подробно, он тратит 30 минут на размышления и генерирует что-то, что совершенно не соответствует тому, что вы хотели. Вы в ярости откатываете назад, затем сдерживая гнев, объясняете ему, на что нужно обратить внимание, что нужно делать, и позволяете ему продолжить генерировать еще 30 минут. В итоге он слышит только часть того, что вы сказали, и продолжает генерировать клубничный торт, в то время как вы только частично добавили подсказки, что приводит к тому, что он продолжает генерировать много клубничных тортов в другом месте. В этот момент вы в ярости указываете на его ошибки, и он говорит: "Я наконец понял", а затем продолжает генерировать что-то бесполезное. После долгих попыток вы наконец сдаётесь и начинаете искать проблемы в коде самостоятельно, потратив 30 минут на то, чтобы смотреть на сгенерированный код, и с каждым разом становитесь все более раздраженным, чувствуя, что это как если бы стажер собрал что-то из интернета и скомпоновал это в кучу мусора. В конце концов, вы в ярости рефакторите код. Эта ситуация становится все более очевидной в сложных проектах (например, связанных с несколькими микросервисами, взаимодействием между фронтендом и бэкендом, коммуникацией между промежуточными программами и т.д.).
Итак, вы начинаете сомневаться в себе: почему другие могут использовать AI для выполнения столь интересных проектов, а код, который я заставляю AI писать, оказывается мусором? После нескольких попыток вы не решаетесь искать различные материалы, надеясь найти правильный способ взаимодействия с AI, и после того, как вы считаете, что нашли его, продолжаете общаться с AI, но результат по-прежнему оказывается бесполезным. Время тратится впустую.
Когда-то Claude Code был королем Vibe Coding и открыл новую эру, фактически повышая точность через многократное выполнение. Предположим, что сгенерированный AI контент имеет только 80% точности, тогда Claude Code через многократное самоиспытание, анализ и повторные изменения повышает точность до 99%, что позволяет генерировать очень хороший код. Но Claude Code, как и Cursor, подвергся различным ограничениям, что привело к резкому снижению изначально невысокой точности. Если раньше 4 исправления могли достичь 99% точности, то после снижения IQ точность составляет только 70%, и чтобы достичь того же результата, ему нужно будет сделать 6 исправлений. Кроме того, Claude ограничил использование, что привело к тому, что теперь в то же время невозможно сгенерировать эффективный код, даже если ограничения достигнуты, это все равно не сработает.
А сейчас Codex почему-то часто хвалят? Главная причина в том, что он любит спрашивать мнение пользователей, он спрашивает: "Есть ли проблемы с моим решением? Можно ли сделать так?" и предлагает несколько вариантов, как улучшить и реализовать. Это хорошо, потому что AI изначально ошибается, и на самом деле ваш ответ помогает им заполнить недостаток точности, позволяя им сгенерировать что-то с точностью близкой к 99% за один раз.
Claude Code - это хороший продукт, но он становится все хуже, потому что точность не достигает желаемого уровня. AI изначально является крупным вероятностным генератором, и ключевым фактором его производительности является то, насколько близко вероятность может приблизиться к 1. В инженерии это просто различные способы, чтобы он многократно исправлялся и приближался к 1. Но снижение IQ и ограничения делают это все более трудным.
С другой стороны, Codex понимает, что чистый AI ненадежен, поэтому передает задачу исправления ошибок пользователям, превращая его из инструмента Vibe Coding в AI помощника, и результат оказывается довольно хорошим.
Этим AI инструментам также стоит подумать о том, как решить эти проблемы при недостаточной точности. Ответ Codex довольно неплох, но является ли это оптимальным решением? Не обязательно, но я лично считаю, что многопользовательское сотрудничество по-прежнему эффективно. Поскольку у каждого AI есть свой способ сопоставления и генерации результатов, перекрестная проверка между несколькими агентами и параллельное мышление - это лучшая формула.
Но это, конечно, не может произойти в этих AI моделях, потому что они, безусловно, будут жестко привязаны к своим моделям, поэтому третьи стороны являются лучшим выбором для этого.
Топ
Рейтинг
Избранное