Усі в захваті від «ШІ для науки» у 2025 році! Наприкінці року, будь ласка, дозвольте мені поділитися своїм занепокоєнням і оптимізмом, особливо щодо штучного інтелекту та біології. Після ще одного року, проведеного глибоко в біологічних базових моделях, медичному ШІ та відкритті ліків, ось 3 уроки, які я засвоїв у 2025 році. 1. Біологія — це не «просто ще одна модальність». Найбільше непорозуміння, яке я досі бачу: «Біологія — це текст + зображення + графіки. Просто масштабуйте трансформатори." Ні. Біологія є причинною, ієрархічною, стохастичною і неповною у спосіб, у який мова і бачення не є. Токени не ідеально відповідають реальності. Ярлики бідні, упереджені і часто хибні. Основна істинність умовна, залежить від контексту і іноді непізнавана. Ми досягли реального прогресу — одноклітинні, візуалізації, геноміки, ЕМК нарешті моделюються разом — але сувора правда така: Більшість біологічних сигналів не є контрольованими проблемами, що чекають на кращі функції втрати. Це проблеми, пов'язані з інтервенціями. Вони вимагають збурень, контрфактів і механізмів, що виходять за межі простого передбачення. Масштабування, звісно, допомагає. Але без причинної структури масштабування здебільшого дає чіткіші кореляції. 2025 рік зміцнив мою віру в те, що біологічні базові моделі мають будуватися навколо збурень, невизначеності та практичності, а не лише на основі навчання репрезентації. 2. Бенчмарки стримують біологію більше, ніж обчислення. Будьмо чесними: бенчмаркінг у ШІ та біології досі не працює. Всі повідомляють про SOTA. Кожен обирає різний зріз набору даних. Кожен налаштовує на різні метрики. Усі уникають потенційного підтвердження....