Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Obecny Vibe Coding nie jest taki wspaniały.
Wyobrażony Vibe Coding powinien wyglądać tak, że wydajesz zadanie, AI myśli, a następnie zadaje ci kilka kluczowych pytań, a potem zaczyna długo pracować nad próbą, w tym czasie możesz zwolnić tempo, napić się gazowanej wody sodowej, obejrzeć krótkie filmy i cieszyć się życiem.
A teraz jest tak, że po wydaniu zadania, ponieważ w jakimś miejscu nie wyjaśniłeś mu szczegółowo, on myśli przez 30 minut, generując coś, co jest zupełnie inne od tego, czego chciałeś, ty wściekły cofasz to, a następnie z trudem tłumaczysz mu w podpowiedziach, na co powinien zwrócić uwagę, co powinien zrobić, a potem pozwalasz mu kontynuować generowanie przez 30 minut, w wyniku czego on słyszy tylko część tego, co mu powiedziałeś, a następnie kontynuuje generowanie torcika truskawkowego, a ponieważ tylko uzupełniłeś część podpowiedzi, w innym miejscu on generuje wiele torcików truskawkowych. W tym momencie wściekle wskazujesz na jego błąd, a on mówi: w końcu rozumiem, a potem kontynuuje generowanie kupy. Po długiej walce w końcu rezygnujesz i zaczynasz samodzielnie szukać problemu w kodzie, spędzając 30 minut na oglądaniu generowanego kodu, co coraz bardziej cię irytuje, czując, że to jakby stażysta skopiował coś z internetu i złożył to w jedną kupę śmieci. Na koniec wściekły przystępujesz do refaktoryzacji kodu. Taka sytuacja jest coraz bardziej widoczna w bardziej skomplikowanych projektach (na przykład tych, które obejmują wiele mikroserwisów, interakcje między frontendem a backendem, komunikację z middleware itp.).
Zaczynasz więc wątpić w siebie, dlaczego inni mogą używać AI do realizacji tak wielu interesujących projektów, podczas gdy kod, który pisze AI, to kupa. Po wielu zmaganiach niepewnie przeszukujesz różne materiały, mając nadzieję znaleźć sposób na poprawną interakcję z AI, a po tym, co uważasz za odkrycie, kontynuujesz komunikację z AI, a rezultat wciąż jest kupą. Czas marnuje się na to.
Kiedyś Claude Code jako król Vibe Coding zapoczątkował nową erę, w rzeczywistości poprawiając efektywność poprzez wielokrotne wykonania, co zwiększało dokładność. Zakładając, że zawartość generowana przez AI ma tylko 80% dokładności, Claude Code poprzez wielokrotne testy, analizy i poprawki podnosił dokładność do 99%, co pozwalało na generowanie bardzo dobrego kodu. Jednak Claude Code, podobnie jak Cursor, obniżał inteligencję i wprowadzał ograniczenia, co powodowało szybki spadek pierwotnie niskiej dokładności. Wcześniej 4 poprawki mogły osiągnąć 99% dokładności, a po obniżeniu inteligencji, jeśli dokładność wynosi tylko 70%, to aby osiągnąć ten sam efekt, potrzebne byłyby 6 poprawek. Dodatkowo ograniczenia w użyciu przez Claude'a sprawiły, że w tym samym czasie nie można było wygenerować skutecznego kodu, nawet jeśli osiągnięto limit, to i tak nie działało.
A teraz dlaczego Codex jest często chwalony? Głównym powodem jest to, że lubi pytać użytkowników o opinie, zapyta: czy mój plan ma jakieś problemy? Czy można to zrobić w ten sposób? Przedstawi ci kilka opcji, jak można poprawić i zrealizować. To jest świetne, ponieważ AI ma błędy, a twoje odpowiedzi pomagają im uzupełnić braki w dokładności, pozwalając na jednorazowe generowanie z blisko 99% dokładnością.
Claude Code to bardzo dobry produkt, ale staje się coraz gorszy, ponieważ dokładność nie osiąga pożądanej wysokości. AI to w końcu duży generator prawdopodobieństwa, a kluczowym czynnikiem decydującym o jego wydajności jest to, czy prawdopodobieństwo wyjścia może być jak najbliższe 1. W inżynierii chodzi tylko o to, aby za pomocą różnych metod doprowadzić go do bliskości 1. Jednak obniżenie inteligencji i ograniczenia sprawiają, że osiągnięcie bliskości 1 staje się coraz trudniejsze.
Z drugiej strony Codex wie, że czyste AI nie jest niezawodne, więc zleca użytkownikom zadanie poprawy błędów, przekształcając się z narzędzia Vibe Coding w asystenta AI, co przynosi całkiem dobre efekty.
Te narzędzia AI również muszą pomyśleć, jak rozwiązać te problemy w przypadku niewystarczającej dokładności. Odpowiedzią Codexa są całkiem dobre, ale czy to jest optymalne rozwiązanie? Niekoniecznie, jednak osobiście uważam, że współpraca wielu agentów wciąż jest skuteczna, skoro każdy AI ma swój własny sposób dopasowania i generowania wyników, to wzajemne weryfikowanie między wieloma agentami i równoległe myślenie to najlepsza formuła.
Jednak ta sytuacja na pewno nie może wystąpić w tych firmach zajmujących się modelami AI, ponieważ na pewno są one zmuszone do korzystania z własnych modeli, dlatego trzecie strony są najlepszym wyborem do realizacji tego zadania. (Nie ma co mówić, co mi na myśl przyjdzie, to mówię)
Najlepsze
Ranking
Ulubione