Все в восторге от "AI для науки" в 2025 году! В конце года позвольте мне поделиться своим беспокойством и оптимизмом, особенно по поводу ИИ и биологии. Проведя еще один год, погружаясь в биологические фундаментальные модели, ИИ в здравоохранении и открытие лекарств, вот 3 урока, которые я усвоил в 2025 году. 1. Биология — это не "просто еще одна модальность." Самое большое заблуждение, которое я все еще вижу: "Биология — это текст + изображения + графики. Просто масштабируйте трансформеры." Нет. Биология причинна, иерархична, стохастична и неполна так, как язык и зрение не являются. Токены не соответствуют реальности. Метки разрозненные, предвзятые и часто неверные. Фактическая истина условна, зависит от контекста и иногда недоступна. Мы добились реального прогресса — модели на основе одиночных клеток, визуализация, геномика, электронные медицинские записи наконец моделируются совместно — но жесткая правда такова: Большинство биологических сигналов не являются контролируемыми задачами, ожидающими лучших функций потерь. Это задачи, основанные на интервенциях. Они требуют возмущений, контрфактов и механизмов, помимо просто предсказания. Масштабирование, безусловно, помогает. Но без причинной структуры масштабирование в основном дает вам более четкие корреляции. 2025 год укрепил мою веру в то, что биологические фундаментальные модели должны строиться вокруг возмущений, неопределенности и действенности, а не только обучения представлениям. 2. Бенчмарки сдерживают биологию больше, чем вычислительные мощности. Давайте будем честными: Бенчмаркинг в ИИ и биологии все еще сломан. Все сообщают о SOTA. Все выбирают разные срезы данных. Все настраивают на разные метрики. Все избегают перспективной валидации....