Semua orang bersemangat tentang "AI untuk Sains." pada tahun 2025! Di akhir tahun, izinkan saya untuk berbagi kegelisahan dan optimisme saya, khususnya tentang AI & biologi. Setelah menghabiskan satu tahun lagi dalam model fondasi biologis, AI perawatan kesehatan, dan penemuan obat, berikut adalah 3 pelajaran yang saya pelajari pada tahun 2025. 1. Biologi bukan "hanya modalitas lain." Kesalahpahaman terbesar yang masih saya lihat: "Biologi adalah teks + gambar + grafik. Cukup skala transformator." Tidak. Biologi bersifat kausal, hierarkis, stokastik, dan tidak lengkap dengan cara yang tidak dimiliki bahasa dan visi. Token tidak sesuai dengan kenyataan. Label jarang, bias, dan seringkali salah. Kebenaran dasar berkondisional, bergantung pada konteks, dan terkadang tidak dapat diketahui. Kami telah membuat kemajuan nyata—sel tunggal, pencitraan, genomik, EHR akhirnya dimodelkan bersama—tetapi kebenarannya adalah ini: Sebagian besar sinyal biologis bukanlah masalah yang diawasi menunggu fungsi kehilangan yang lebih baik. Mereka adalah masalah yang didorong oleh intervensi. Mereka menuntut gangguan, kontrafaktual, dan mekanisme, di luar sekadar prediksi. Penskalaan jelas membantu. Tetapi tanpa struktur kausal, penskalaan sebagian besar memberi Anda korelasi yang lebih tajam. 2025 memperkuat keyakinan saya bahwa model fondasi biologis harus dibangun di sekitar gangguan, ketidakpastian, dan kemampuan tindakan, bukan hanya pembelajaran representasi. 2. Tolok ukur menahan biologi lebih dari komputasi. Mari kita jujur: Benchmarking dalam AI & biologi masih rusak. Semua orang melaporkan SOTA. Setiap orang memilih irisan himpunan data yang berbeda. Setiap orang mendengarkan metrik yang berbeda. Semua orang menghindari validasi prospektif....