Alla är taggade på "AI för vetenskap." år 2025! I slutet av året får jag dela med mig av min oro och optimism, särskilt om AI och biologi. Efter att ha tillbringat ytterligare ett år djupt i biologiska grundmodeller, hälsomedicinsk AI och läkemedelsupptäckt, här är tre lärdomar jag fick under 2025. 1. Biologi är inte "bara en annan modalitet." Den största missuppfattningen jag fortfarande ser: "Biologi är text + bilder + grafer. Bara skala transformatorer." Nej. Biologin är kausal, hierarkisk, stokastisk och ofullständig på sätt som språk och syn inte är. Tokens motsvarar inte verkligheten korrekt. Etiketter är sparsamma, partiska och ofta felaktiga. Sanningen på marken är villkorad, kontextberoende och ibland omöjlig att förstå. Vi har gjort verkliga framsteg—encellig, avbildning, genomik, EHR modelleras äntligen gemensamt—men den hårda sanningen är denna: De flesta biologiska signaler är inte övervakade problem som väntar på bättre förlustfunktioner. De är interventionsdrivna problem. De kräver störningar, kontrafaktiska faktorer och mekanismer, bortom bara förutsägelse. Skalning hjälper förstås. Men utan kausal struktur ger skalning oftast skarpare korrelationer. 2025 stärkte min tro på att biologiska grundmodeller måste byggas kring störningar, osäkerhet och handlingsbarhet, inte bara representationsinlärning. 2. Benchmarks håller tillbaka biologin mer än beräkningen gör. Låt oss vara ärliga: benchmarking inom AI och biologi är fortfarande trasigt. Alla rapporterar SOTA. Alla väljer en annan datamängdsskiva. Alla justerar för olika mått. Alla undviker potentiell bekräftelse....