În biologie, legile de scalare funcționează... ... până când nu o fac. Pentru predicția fitness-ului, performanța modelului de limbaj proteic crește odată cu dimensiunea modelului până când se plafonează și apoi se degradează. Pe măsură ce pierderea de antrenament (NLL) scade, modelele încep să prezică probabilități mai mari de secvență și se corelează mai puțin cu fitness-ul de bază. Exemplul 10.001 de ce AI pentru biologie necesită o analiză atentă a distribuțiilor subiacente, a obiectivelor de antrenament și a zeci de alte detalii. Intersecția este bogată, dar necesită o muncă atentă în ambele discipline.
Mare muncă de detectiv de la Shen Lab de la Columbia:
13,08K