До 2027 року капітал від ~$1,1 до ~$1,6 трлн планується розгорнути на дата-центрах! Хоча це захоплююче і важливо, економіка потребує уважного розгляду.
З сьогоднішнім маржелем зростання ШІ ~30-40% ці долари повернуться до 2033 року, лише якщо ефективність продовжуватиме зростати, штучний інтелект ставатиме кращим, а вимоги зростатимуть.
Сталий шлях є гібридним: надсилайте якомога більше висновків на пристрої, а лише важкі речі перенесіть у хмару. Маржа програмного забезпечення на пристроях становить близько 70-90% при набагато нижчих поточних капітальних витратах.
Більше на пристрої:
> більш приватними
> швидше
> екологічнішим
> і значно краща юніт-економіка.
Завдяки тому, що Nanos забезпечує результати на рівні кордону для спеціалізованих завдань і працює локально на пристроях, це наш перший крок на шляху до штучного інтелекту в хмарі планетарного масштабу, який є одночасно доступним і економічно вигідним.
Давайте перемістимо медіанний токен до краю!
💧⚛️
Представляємо Liquid Nanos ⚛️ — нове сімейство надзвичайно крихітних моделей для конкретних завдань, які забезпечують продуктивність класу GPT-4o під час роботи безпосередньо на телефонах, ноутбуках, автомобілях, вбудованих пристроях і графічних процесорах із найменшою затримкою та найвищою швидкістю генерації.
> розмір моделі: від 350 М до 2,6 В
> побудована на LFM2, нашій ефективній архітектурі моделі v2
> змагатися з моделями в сотні разів більшими
> дозволяють виконувати основні агентні завдання: точне вилучення даних, багатомовний переклад, виклик інструментів, математику та RAG. 1/п
Зустрічайте LFM2-2.6B, найновішого представника нашої родини LFM2, нового лідера в класі моделей 3B.
> легка вага з параметрами 2,6 В
> швидкий, створений на основі нашої ефективної архітектури v2 (короткі конві + увага до групових запитів)
> Тренувався на 10T токенах32k довжина контексту
> з відкритою вагою, багатомовність, чудові можливості слідування за інструкціями
🧵 Для отримання додаткової інформації