2025年の「AI for Science.」にはみんなが盛り上がっています!年末には、特にAIと生物学についての不安と楽観を共有させてください。 生物学的基盤モデル、医療AI、創薬にさらに1年を費やした後、2025年に学んだ3つの教訓を紹介します。 1. 生物学は「ただの一つのモダリティ」ではありません。 私が今でも見かける最大の誤解: 「生物学はテキスト+画像+グラフです。変圧器をスケールで調整すればいいんだ。」 いいえ。生物学は因果的で階層的、確率的で、言語や視覚とは異なり不完全です。 トークンは現実ときれいに一致しません。 ラベルはまばらで偏っており、しばしば間違っています。 グラウンドトゥルースは条件付きで文脈に依存し、時には知り得ないものです。 私たちは実際に進展を遂げました。単細胞、画像診断、ゲノミクス、電子健康記録(EHR)がついに共同でモデル化されつつありますが、厳しい現実はこうです: ほとんどの生物学的信号は、より良い損失関数を待つ監督付き問題ではありません。 それらは介入によって動く問題です。それらは単なる予測を超えた摂動、反事実、メカニズムを求めます。 もちろんスケーリングも役立ちます。しかし因果構造がなければ、スケーリングは主により鮮明な相関関係をもたらします。 2025年は、生物学的基盤モデルは単なる表現学習ではなく、摂動、不確実性、実行可能性を中心に構築されるべきだという私の信念を強めました。 2. ベンチマークはコンピュータよりも生物学の足を引っ張っています。 正直に言いましょう:AIや生物学のベンチマークはまだ壊れています。 みんなSOTAを報告します。みんなそれぞれ異なるデータセットのスライスを選びます。 みんな異なる指標に合わせて調整します。誰もが将来の承認を避けています。...