Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Yohei
Użytkownik Yohei udostępnił ponownie
Przedstawiamy nowy rodzaj technologii obywatelskiej, możliwej dzięki AI. Każdy obywatel powinien mieć na żywo, systemowy widok na swój rząd, a dzisiaj wprowadzamy to w SF!
Śledź podmioty rządowe, wydatki, wiadomości i więcej w czasie rzeczywistym. Dzięki LLM możemy to wprowadzić do każdego miasta. Kto będzie następny?
64,39K
Użytkownik Yohei udostępnił ponownie
W erze wstępnego uczenia, to, co miało znaczenie, to teksty z internetu. Głównie chciałbyś mieć dużą, różnorodną, wysokiej jakości kolekcję dokumentów internetowych, z których można się uczyć.
W erze nadzorowanego dostrajania, to były rozmowy. Zatrudniani są pracownicy kontraktowi do tworzenia odpowiedzi na pytania, trochę jak to, co można zobaczyć na Stack Overflow / Quora, czy innych, ale skierowane w stronę zastosowań LLM.
Żadne z powyższych nie zniknie (moim zdaniem), ale w tej erze uczenia przez wzmocnienie, to teraz środowiska. W przeciwieństwie do powyższych, dają LLM możliwość rzeczywistej interakcji - podejmowania działań, obserwowania wyników itd. Oznacza to, że można mieć nadzieję na znacznie lepsze wyniki niż statystyczna imitacja ekspertów. Mogą być używane zarówno do treningu modelu, jak i oceny. Ale tak jak wcześniej, podstawowym problemem jest teraz potrzeba dużego, różnorodnego, wysokiej jakości zestawu środowisk, jako ćwiczeń dla LLM do praktyki.
W pewnym sensie przypomina mi to pierwszy projekt OpenAI (gym), który był dokładnie ramą mającą na celu zbudowanie dużej kolekcji środowisk w tym samym schemacie, ale to było dużo przed LLM. Tak więc środowiska były prostymi akademickimi zadaniami kontrolnymi tamtych czasów, takimi jak cartpole, ATARI itd. Hub środowisk @PrimeIntellect (i repozytorium `verifiers` na GitHubie) buduje zmodernizowaną wersję, skierowaną specjalnie na LLM, i to jest świetny wysiłek/pomysł. Zasugerowałem, że ktoś zbuduje coś podobnego na początku tego roku:
Środowiska mają tę właściwość, że gdy szkielet ramy jest na miejscu, w zasadzie społeczność/branża może równolegle działać w wielu różnych dziedzinach, co jest ekscytujące.
Ostatnia myśl - osobiście i długoterminowo, jestem optymistyczny co do środowisk i interakcji agentowych, ale pesymistyczny co do uczenia przez wzmocnienie w szczególności. Uważam, że funkcje nagrody są bardzo podejrzane, i myślę, że ludzie nie używają RL do nauki (może robią to w przypadku niektórych zadań motorycznych itd., ale nie w zadaniach rozwiązywania problemów intelektualnych). Ludzie używają różnych paradygmatów uczenia, które są znacznie potężniejsze i bardziej efektywne pod względem próbkowania i które nie zostały jeszcze odpowiednio wynalezione i skalowane, chociaż istnieją wczesne szkice i pomysły (jako jeden przykład, pomysł "uczenia się z podpowiedzi systemowych", przenosząc aktualizację na tokeny/konteksty, a nie wagi i opcjonalnie destylując do wag jako osobny proces, trochę jak sen).
426,95K
teraz oficjalnie #1 na liście liderów MLE @openai!


792BB823 sie, 00:01
Przedstawiamy NEO:
Pierwszego autonomicznego inżyniera uczenia maszynowego.
Działa jak pełnostackowy inżynier ML, który nigdy nie śpi: zajmuje się eksploracją danych, inżynierią cech, treningiem, dostrajaniem, wdrażaniem i monitorowaniem, od początku do końca.
Zasilany przez 11 wyspecjalizowanych agentów, NEO działa autonomicznie, oszczędzając inżynierom ML tysiące godzin i sprawiając, że są 10 razy szybszy.
Wyniki:
Testowany w 75 konkursach Kaggle, NEO zdobył medal w 34,2% z nich, znacznie przewyższając agenta RD Microsoftu (22,4%) w teście MLE OpenAI.
To ustanawia nowy standard dla autonomicznych systemów ML.
NEO działa na nowatorskim orkiestratorze wieloagentowym, zasilanym przez silnik rozumowania wieloetapowego, protokół transferu kontekstu i pamięć agenta, stworzony do rozwiązywania złożonych przepływów pracy od początku do końca.
A w trybie z człowiekiem w pętli możesz kierować, inspekcjonować i nadpisywać każdy krok.
Zawsze masz kontrolę.
NEO jest stworzony do rzeczywistych przepływów pracy i gotowy do produkcji.
NEO jest tutaj, aby uczynić każdego inżyniera ML naprawdę nadludzkim.
Obejrzyj NEO w akcji:
24,38K
Najlepsze
Ranking
Ulubione