Представьте себе единую модель ИИ, которая может самостоятельно улучшать свои навыки рассуждения без какого-либо человеческого обучения или внешних наборов данных. Звучит как научная фантастика? Что ж, последнее исследование Nvidia превращает это в реальность с помощью революционной структуры под названием Multi-Agent Evolve (MAE). MAE: саморазвивающаяся система с тремя ролями, выведенными из одной и той же модели: 1. Предложитель: Формулирует сложные, но решаемые вопросы. 2. Решатель: Отвечает на эти вопросы с пошаговым рассуждением. 3. Судья: Оценивает как вопросы, так и решения, присваивая надежные оценки. Это создает внутреннюю экосистему, где модель учится на своих собственных выводах, постоянно повышая свои способности к рассуждению. На модели Nvidia Qwen 2.5-3B этот метод достиг впечатляющего увеличения точности на +4.54% по нескольким эталонам, превосходя традиционную контролируемую донастройку. Более важно: ↳ Он соответствует производительности более сложных установок самоигры, которые полагаются на внешние инструменты. ↳ Он снижает зависимость от человеческих меток и внешних сред. ↳ Он демонстрирует масштабируемую, самоподдерживающуюся разработку ИИ, идеальную для задач открытого рассуждения. Этот прорыв позиционирует саморазвивающийся ИИ как многообещающий путь к автономным системам, способным к самоулучшению в различных сложных областях. Это намекает на будущие модели ИИ, которые смогут адаптироваться, учиться и улучшать себя с минимальным вмешательством человека, подобно биологической эволюции, но в цифровой сфере. Источник: