Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Abbiamo condotto uno studio controllato randomizzato per vedere quanto gli strumenti di codifica AI velocizzano gli sviluppatori open source esperti.
I risultati ci hanno sorpreso: gli sviluppatori pensavano di essere più veloci del 20% con gli strumenti di intelligenza artificiale, ma in realtà erano più lenti del 19% quando avevano accesso all'intelligenza artificiale rispetto a quando non lo avevano.

Abbiamo reclutato 16 sviluppatori open source esperti per lavorare su 246 attività reali nei loro repository (media 22k+ stelle, 1M+ righe di codice).
Abbiamo assegnato in modo casuale ogni attività per consentire l'intelligenza artificiale (in genere Cursor Pro con Claude 3.5/3.7) o per non consentire l'aiuto dell'intelligenza artificiale.

All'inizio dello studio, gli sviluppatori avevano previsto che sarebbero stati accelerati del 24%. Dopo aver effettivamente svolto il lavoro, hanno stimato di essere stati accelerati del 20%. Ma si è scoperto che in realtà sono stati rallentati del 19%.

Quando l'intelligenza artificiale è consentita, gli sviluppatori dedicano meno tempo alla codifica e alla ricerca di informazioni e trascorrono invece tempo a sollecitare l'intelligenza artificiale, ad attendere/rivedere gli output dell'intelligenza artificiale e a rimanere inattivi. Non troviamo un'unica ragione per il rallentamento: è guidato da una combinazione di fattori.

Perché abbiamo condotto questo studio?
I benchmark degli agenti di intelligenza artificiale hanno dei limiti: sono autonomi, utilizzano il punteggio algoritmico e mancano di interazione umana dal vivo. Ciò può rendere difficile dedurre direttamente l'impatto nel mondo reale.
Se vogliamo un sistema di allerta precoce per capire se la ricerca e lo sviluppo dell'IA vengono accelerati dall'IA stessa, o addirittura automatizzati, sarebbe utile essere in grado di misurarlo direttamente nelle prove degli ingegneri del mondo reale, piuttosto che fare affidamento su proxy come benchmark o informazioni ancora più rumorose come gli aneddoti.
Cosa portiamo via?
1. Sembra probabile che per alcune impostazioni importanti, i recenti strumenti di intelligenza artificiale non abbiano aumentato la produttività (e potrebbero in effetti diminuirla).
2. Le autovalutazioni dell'accelerazione sono inaffidabili: per comprendere l'impatto dell'IA sulla produttività, abbiamo bisogno di esperimenti in natura.
576,12K
Principali
Ranking
Preferiti