Сегодня мы представляем Power Retention, новую архитектуру, выходящую за рамки Transformers. Она позволяет LLM эффективно обрабатывать миллионы токенов, открывая возможности для приложений с длинным контекстом, которые ранее были слишком дорогими.