每個人都對 2025 年的「AI 科學」感到興奮!在年底,請允許我分享我對 AI 和生物學的擔憂和樂觀。 在花了一年時間深入研究生物基礎模型、醫療 AI 和藥物發現後,這是我在 2025 年學到的三個教訓。 1. 生物學不僅僅是「另一種模式」。 我仍然看到的最大誤解是: 「生物學是文本 + 圖像 + 圖表。只需擴展變壓器。」 不。生物學是因果的、層次的、隨機的,並且在某些方面是不完整的,這些方面與語言和視覺不同。 標記與現實並不乾淨對應。 標籤稀疏、有偏見,且經常錯誤。 真實情況是有條件的、依賴於上下文的,有時是不可知的。 我們已經取得了真正的進展——單細胞、成像、基因組學、電子健康記錄終於被共同建模——但殘酷的事實是: 大多數生物信號不是等待更好損失函數的監督問題。 它們是干預驅動的問題。它們需要擾動、反事實和機制,而不僅僅是預測。 擴展顯然有幫助。但沒有因果結構,擴展主要給你更清晰的相關性。 2025 年加強了我對生物基礎模型必須圍繞擾動、不確定性和可行性構建的信念,而不僅僅是表示學習。 2. 基準測試比計算能力更拖慢生物學的進步。 老實說:AI 和生物學中的基準測試仍然是破碎的。 每個人都報告 SOTA。每個人選擇不同的數據集切片。 每個人調整不同的指標。每個人避免前瞻性驗證。...