Alle er gira på «AI for vitenskap» i 2025! På slutten av året, la meg dele min uro og optimisme, spesielt om AI og biologi. Etter å ha tilbrakt enda et år dypt i biologiske grunnlagsmodeller, helse-AI og legemiddelutvikling, er her tre lærdommer jeg lærte i 2025. 1. Biologi er ikke «bare en annen modalitet.» Den største misforståelsen jeg fortsatt ser: "Biologi er tekst + bilder + grafer. Bare skaler transformatorer." Nei. Biologi er kausal, hierarkisk, stokastisk og ufullstendig på måter som språk og syn ikke er. Tokens samsvarer ikke helt med virkeligheten. Merkelappene er sparsomme, partiske og ofte feil. Grunnens sannhet er betinget, kontekstavhengig og noen ganger uforståelig. Vi har gjort reelle fremskritt—enkeltcellede, bildediagnostikk, genomikk, EPJ-er blir endelig modellert sammen—men den harde sannheten er denne: De fleste biologiske signaler er ikke overvåkede problemer som venter på bedre tapfunksjoner. De er intervensjonsdrevne problemer. De krever forstyrrelser, kontrafaktiske forhold og mekanismer, utover bare prediksjon. Skalering hjelper selvfølgelig. Men uten kausal struktur gir skalering stort sett skarpere korrelasjoner. 2025 forsterket min tro på at biologiske grunnlagsmodeller må bygges rundt forstyrrelser, usikkerhet og handlingsbarhet, ikke bare representasjonslæring. 2. Benchmarks holder biologien tilbake mer enn beregningen gjør. La oss være ærlige: Benchmarking innen AI og biologi er fortsatt ødelagt. Alle rapporterer SOTA. Alle velger en forskjellig datasettskive. Alle tilpasser seg en forskjellig måleparameter. Alle unngår prospektiv validering....