Магазин DApp | Web3-центр мероприятий и игр | Кошелек OKX

Раздачи и награды Web3

background background

discoveryBanners

Актуальные темы

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN+9,73 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Anshuman (e/ia)

Anshuman (e/ia)

Anshuman (e/ia)20 сент., 21:18

Вы на интервью на должность ML Engineer в Perplexity, и интервьюер спрашивает: "Ваш LLM генерирует миллионы ответов ежедневно. Как вы оцениваете качество без ручного обзора?" Вот как вы отвечаете:

163,48K

Anshuman (e/ia)

Anshuman (e/ia)19 сент., 11:50

за последнюю неделю я глубоко изучал RL-окружения. блог скоро появится. пока могу сказать, что оценки достаточно хороши для LLM, но для агентов нам нужны окружения, где они могут учиться с обратной связью. этот блог будет в основном о написании окружений с проверяющими. @willccbb и @PrimeIntellect проделали очень значимую работу!

26,3K

Топ

Рейтинг

Избранное

©2017 - 2025 WEB3.OKX.COM

Русский 简体中文繁體中文 English Tiếng Việt Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

Подробнее об OKX Web3

Скачать Академия О нас Вакансии Связаться с нами Условия оказания услуг Уведомление о конфиденциальности X (бывший Twitter)

Продукт

Панель кошелька Обмен Маркетплейс DeFi Discover Разработка Обозреватель Безопасность

Поддержка

Центр поддержки Защита от фишинга Объявления График комиссий DEX Сообщество ОКХ Кошелек Bitcoin Кошелек Ethereum Кошелек Solana