Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elie
> проект Suncatcher досліджує, як одного дня ми зможемо побудувати масштабовані обчислювальні системи машинного навчання в космосі, використовуючи більше енергії Сонця
Схоже, що міжпланетний дилоко все-таки 🚀 був не жартом

Sundar Pichai5 лист., 01:01
Наші ТПУ прямують у космос!
Натхненний нашою історією зйомок Місяця, від квантових обчислень до автономного водіння, проект Suncatcher досліджує, як одного дня ми зможемо побудувати масштабовані обчислювальні системи машинного навчання в космосі, використовуючи більше енергії Сонця (яке випромінює більше енергії, ніж у 100 трильйонів разів перевищує загальне виробництво електроенергії людством).
Як і будь-який місячний знімок, він вимагатиме від нас вирішення багатьох складних інженерних завдань. Ранні дослідження показують, що наші TPU покоління Trillium (наші тензорні процесори, спеціально створені для штучного інтелекту) вижили без пошкоджень під час випробувань у прискорювачі частинок для імітації рівнів радіації на низькій навколоземній орбіті. Однак все ще залишаються значні проблеми, такі як управління температурою та надійність системи на орбіті.
Знадобляться додаткові випробування та прориви, оскільки ми ведемо відлік часу для запуску двох прототипів супутників з @planet до початку 2027 року, що стане нашою наступною віхою з багатьох. Дуже раді, що ми є частиною всіх інновацій, що відбуваються в (цьому) просторі!

2,74K
> побудувати нову базову модель на порядки складніше, ніж тонко налаштувати відкриту модель і оптимізувати висновок.
Дивно, наскільки мало обговорюється той факт, що більшість стартапів (навіть добре фінансованих) не можуть побудувати власні базові моделі і покладаються на відкриті джерела своїх лабораторій Frontier Chines.

Nick30 жовт. 2025 р.
Причина, по якій Cursor і Windsurf випустили моделі, оптимізовані для швидкості, полягає в тому, що це набагато більш здійсненно, ніж побудова базової моделі, що просуває інтелект
1. Візьміть QWEN3 і точно налаштуйте його через RL на вашому джгуті
2. шльопнути його на апаратному забезпеченні Cerebras (або оптимізованому графічному процесорі)
3. Дозвольте цій середньо-розумній, надшвидкій моделі готувати
Для компаній-агентів з кодування, якщо ви хочете вивести на ринок щось цінне, побудувати нову базову модель на порядки складніше, ніж тонко налаштувати відкриту модель і оптимізувати висновок.
Чесно кажучи, це ефективний спосіб випустити щось, що наближається до кордону Парето, і мені подобається, що компанії-агенти з кодування починають брати участь.
Але не плутайте це з компаніями-кодувальниками, які заявляють «середньо розумні, але швидкі > дуже розумні, але повільні»
48,66K
Найкращі
Рейтинг
Вибране


