Wszyscy są podekscytowani „AI dla nauki” w 2025 roku! Na koniec roku pozwólcie, że podzielę się moim niepokojem i optymizmem, szczególnie w kwestii AI i biologii. Po spędzeniu kolejnego roku głęboko w modelach podstawowych biologii, AI w opiece zdrowotnej i odkrywaniu leków, oto 3 lekcje, które nauczyłem się w 2025 roku. 1. Biologia to nie „tylko inna modalność.” Największe nieporozumienie, które wciąż widzę: „Biologia to tekst + obrazy + wykresy. Po prostu skaluj transformery.” Nie. Biologia jest przyczynowa, hierarchiczna, stochastyczna i niekompletna w sposób, w jaki język i wizja nie są. Tokeny nie odpowiadają czysto rzeczywistości. Etykiety są rzadkie, stronnicze i często błędne. Prawda podstawowa jest warunkowa, zależna od kontekstu i czasami niepoznawalna. Zrobiliśmy prawdziwy postęp — modele pojedynczych komórek, obrazowanie, genomika, EHR są w końcu modelowane wspólnie — ale twarda prawda jest taka: Większość sygnałów biologicznych nie jest problemami nadzorowanymi czekającymi na lepsze funkcje straty. Są to problemy napędzane interwencjami. Wymagają perturbacji, kontrfaktycznych i mechanizmów, wykraczających poza samą predykcję. Skalowanie oczywiście pomaga. Ale bez struktury przyczynowej, skalowanie głównie daje ostrzejsze korelacje. Rok 2025 wzmocnił moje przekonanie, że modele podstawowe biologii muszą być budowane wokół perturbacji, niepewności i wykonalności, a nie tylko uczenia reprezentacji. 2. Benchmarki powstrzymują biologię bardziej niż obliczenia. Bądźmy szczerzy: Benchmarking w AI i biologii wciąż jest zepsuty. Wszyscy raportują SOTA. Wszyscy wybierają inny fragment zbioru danych. Wszyscy dostosowują do innej metryki. Wszyscy unikają walidacji prospektywnej....