Tutti sono entusiasti riguardo a "AI for Science." nel 2025! Alla fine dell'anno, permettetemi di condividere il mio disagio e ottimismo, specificamente riguardo a AI e biologia. Dopo aver trascorso un altro anno immerso nei modelli biologici fondamentali, nell'AI per la salute e nella scoperta di farmaci, ecco 3 lezioni che ho appreso nel 2025. 1. La biologia non è "solo un'altra modalità." Il più grande fraintendimento che vedo ancora: "La biologia è testo + immagini + grafici. Basta scalare i trasformatori." No. La biologia è causale, gerarchica, stocastica e incompleta in modi in cui il linguaggio e la visione non lo sono. I token non corrispondono pulitamente alla realtà. Le etichette sono scarse, distorte e spesso errate. La verità di base è condizionale, dipendente dal contesto e talvolta inconoscibile. Abbiamo fatto progressi reali: modelli a singola cellula, imaging, genomica, EHR sono finalmente modellati congiuntamente—ma la dura verità è questa: La maggior parte dei segnali biologici non sono problemi supervisionati in attesa di migliori funzioni di perdita. Sono problemi guidati da interventi. Richiedono perturbazioni, controfattuali e meccanismi, oltre alla semplice previsione. Scalare ovviamente aiuta. Ma senza una struttura causale, scalare ti dà principalmente correlazioni più nitide. Il 2025 ha rafforzato la mia convinzione che i modelli biologici fondamentali devono essere costruiti attorno a perturbazione, incertezza e azionabilità, non solo apprendimento della rappresentazione. 2. I benchmark stanno trattenendo la biologia più del calcolo. Siamo onesti: il benchmarking in AI e biologia è ancora rotto. Tutti riportano SOTA. Ognuno sceglie un diverso sottoinsieme di dati. Ognuno ottimizza per una metrica diversa. Ognuno evita la validazione prospettica....