Я был одним из 16 разработчиков в этом исследовании. Я хотел бы высказать свое мнение о причинах и стратегиях смягчения последствий замедления разработки. Я скажу в качестве крючка "зачем вас слушать?", что я испытал -38% ускорение AI на назначенных мне задачах. Я думаю, что прозрачность помогает сообществу.
METR
METR11 июл. 2025 г.
We ran a randomized controlled trial to see how much AI coding tools speed up experienced open-source developers. The results surprised us: Developers thought they were 20% faster with AI tools, but they were actually 19% slower when they had access to AI than when they didn't.
Во-первых, я думаю, что ускорение ИИ очень слабо коррелирует со способностями любого разработчика. Все разработчики в этом исследовании очень хорошие. Я думаю, что это больше связано с попаданием в режимы неудачи, как в способностях LLM, так и в рабочем процессе человека. Я работаю с кучей замечательных разработчиков, которые проходят предварительную подготовку, и я думаю, что люди сталкиваются со многими из тех же проблем. Мы любим говорить, что LLM — это инструменты, но относимся к ним скорее как к волшебной пуле. Буквально любой разработчик может подтвердить удовлетворение от того, что наконец-то отладил острую проблему. LLM — это большая кнопка быстрого доступа к допамину, которая может решить вашу проблему одним выстрелом. Вы продолжаете нажимать кнопку, которая с вероятностью 1% все исправит? Это намного приятнее, чем изнурительная альтернатива, по крайней мере, для меня.
Я думаю, что случаи чрезмерного использования LLM могут произойти, потому что легко оптимизировать для получения удовольствия, а не для времени на решение во время работы. Я нажимаю табуляцию в курсоре на 5 часов вместо отладки на 1 час:
В-третьих, очень легко отвлечься во время простоя во время генерации LLM. Экономика внимания в социальных сетях жестока, и я думаю, что люди тратят 30 минут на прокрутку, «ожидая» своего 30-секундного поколения. Все, что я могу сказать по этому поводу, это то, что мы должны знать свои подводные камни и постараться продуктивно заполнить это время генерации LLM: - Если задача требует высокой концентрации, потратьте это время либо на работу над подзадачей, либо на размышления над дополнительными вопросами. Даже если модель одним выстрелом задает ваш вопрос, что еще я не понимаю? - Если задача требует низкой концентрации, тем временем выполните еще одну небольшую задачу (ответьте на электронное письмо/Slack, прочитайте или отредактируйте еще один абзац и т. д.). Как всегда, в этом помогают небольшие меры цифровой гигиены (блокировщики сайтов, телефон на dnd и т.д.). Извините, что я бабушка, но для меня это работает :)
Некоторые заключительные заявления: - METR - замечательная организация для работы, и они сильные ученые. Мне понравилось как участвовать в этом исследовании, так и читать его результаты. - Я не какой-то гуру LLM, пытающийся проповедовать. Представьте себе, что я публикую личную запись в дневнике и надеюсь, что другие смогут извлечь пользу из моего самоанализа.
1,96M