Ich war einer der 16 Entwickler in dieser Studie. Ich wollte über meine Meinung zu den Ursachen und Strategien zur Risikominderung für die Verlangsamung der Entwicklung sprechen. Ich sage als "Warum sollte ich Ihnen zuhören?", dass ich eine KI-Beschleunigung von -38% bei den mir zugewiesenen Problemen erlebt habe. Ich denke, Transparenz hilft der Community.
METR
METR11. Juli 2025
Wir haben eine randomisierte, kontrollierte Studie durchgeführt, um zu sehen, wie sehr KI-Codierungstools erfahrene Open-Source-Entwickler beschleunigen. Die Ergebnisse haben uns überrascht: Entwickler dachten, sie wären mit KI-Tools 20 % schneller, aber sie waren tatsächlich 19 % langsamer, wenn sie Zugang zu KI hatten, als wenn sie keinen hatten.
Erstens denke ich, dass die Beschleunigung der KI sehr schwach mit den Fähigkeiten eines Entwicklers korreliert. Alle Entwickler in dieser Studie sind sehr gut. Ich denke, es hat mehr damit zu tun, in den Fehlermodus zu verfallen, sowohl in der Fähigkeit des LLM als auch im Arbeitsablauf des Menschen. Ich arbeite mit einer Menge großartiger Vorschulungsentwickler zusammen, und ich denke, die Leute stehen vor vielen der gleichen Probleme. Wir sagen gerne, dass LLMs Werkzeuge sind, aber behandeln Sie sie eher wie ein Wundermittel. Buchstäblich jeder Entwickler kann bestätigen, wie zufrieden es ist, endlich ein heikles Problem zu debuggen. LLMs sind eine große Dopamin-Tastenkombination, die Ihr Problem mit einem Schlag lösen kann. Drücken Sie immer wieder den Knopf, der eine Chance von 1% hat, alles zu reparieren? Es macht viel mehr Spaß als die zermürbende Alternative, zumindest für mich.
Ich denke, dass Fälle von LLM-Überbeanspruchung auftreten können, weil es einfach ist, es für den wahrgenommenen Spaß zu optimieren, anstatt die Zeit bis zur Lösung während der Arbeit zu verkürzen. Ich drücke 5 Stunden lang die Tabulatortaste im Cursor, anstatt 1 Stunden lang zu debuggen:
Drittens ist es sehr einfach, sich in der Ausfallzeit ablenken zu lassen, während LLMs generiert werden. Die Aufmerksamkeitsökonomie in den sozialen Medien ist brutal, und ich denke, die Leute verbringen 30 Minuten damit, zu scrollen, während sie auf ihre 30-Sekunden-Generation "warten". Alles, was ich dazu sagen kann, ist, dass wir unsere eigenen Fallstricke kennen und versuchen sollten, diese Zeit der LLM-Generierung produktiv zu füllen: - Wenn die Aufgabe eine hohe Konzentration erfordert, verbringen Sie diese Zeit entweder mit der Arbeit an einer Teilaufgabe oder mit dem Nachdenken über Folgefragen. Selbst wenn das Model Ihre Frage mit einem One-Shot beantwortet, was verstehe ich sonst noch nicht? - Wenn die Aufgabe einen geringen Fokus erfordert, erledigen Sie in der Zwischenzeit eine andere kleine Aufgabe (auf E-Mails antworten, einen weiteren Absatz lesen oder bearbeiten usw.). Dabei helfen wie immer kleine digitale Hygieneschritte (Website-Blocker, Handy auf dnd, etc). Tut mir leid, dass ich ein Grampy bin, aber es funktioniert für mich :)
Einige abschließende Statements: - METR ist eine wunderbare Organisation, mit der man zusammenarbeiten kann, und sie sind starke Wissenschaftler. Ich habe es geliebt, an dieser Studie teilzunehmen und ihre Ergebnisse zu lesen. - Ich bin nicht irgendein LLM-Guru, der versucht zu predigen. Stellen Sie sich das so vor, dass ich einen persönlichen Tagebucheintrag veröffentliche und hoffe, dass andere von meiner Selbstbeobachtung profitieren können.
1,96M