Elsker dette prosjektet!! Gratulerer @samuelhking, @pdhsu og @arcinstitute mannskap! Mine 2 cent: AI som brukes til biologisk design er best tenkt på som en oversetter.  Lar oss snakke på engelsk og få det oversatt til DNA og omvendt.  Vi vet ikke hvordan vi skal designe en av deler, men Evo 1/2 ble trent ved å "lese" over 2 millioner faggenomer fra naturen, og så lærte den å "snakke"-DNA.  Så da kan vi be den om å generere en - akkurat som du kan be ChatGPT om å generere et dikt til deg på kinesisk, selv om du ikke snakker det selv. Vi hadde allerede trent AI-modeller på språket til proteiner med modeller som Alphafold og ESM, og det fungerte bra - denne artikkelen viser at vi kan gjøre det på et høyere kompleksitetsnivå.  Denne AI-modellen snakker multi-gen faggenomer, ikke bare individuelle gener.  Veldig spennende demonstrasjon og arbeidet beviser det fint ved å faktisk lage og teste designede fager. De fungerer! Det er to ting som er åpenbare fremtidige retninger etter min mening, og som til slutt vil lykkes: (1) Modellen bør trenes på nytt basert på hva den lærer om fagene som ble designet, slik at den kan bli bedre til å forstå hva mennesket ber om og oversette det til DNA.  Denne «forsterkende læringen» ligner på hvordan Google lærte AI-modeller å spille sjakk – du lar modellen spille et parti og forteller den om den vant eller tapte.  Her lar du modellen designe millioner av fager, bygge dem i laboratoriet og deretter fortelle den ytelsen til de forskjellige designene. (2) Vi bør se om modeller trent på millioner av bakteriegenomer kan gjøre oss i stand til å bygge en AI-designet hel bakteriecelle som ligner på det som ble gjort her for en. Dette vil se om vi kan gå fra å oversette en engelsk forespørsel til en DNA-bok (500 000 bokstaver DNA for de enkleste bakteriene) i stedet for DNA-diktet til fagen (5 000 bokstaver DNA i en).  Dette ville være en vitenskapelig milepæl på nasjonal skala ettersom celler er byggesteinene i alt liv, og USA bør sørge for at vi kommer til det først. For å gjøre både (1) og (2) trenger vi dramatiske forbedringer i effektiviteten ved å gjøre den faktiske våtlaboratoriebiologien som trengs for å bygge DNA og teste ytelsen til organismer.  Det er en indikasjon på at de bare bygde 302 fagdesign og testet 16 design - det er fordi vått laboratoriearbeid er for tregt og dyrt.  Svaret på det er laboratorieautomatisering - jeg har vært glad for å se NSF investere 100 millioner dollar i AI-kontrollerbare, automatiserte skylaboratorier og annen innsats som vil gjøre amerikansk vitenskapelig infrastruktur mer effektiv og industriell skala.  Det hvite hus' AI-handlingsplan kalte også behovet for disse «skyaktiverte laboratoriene». Igjen, fantastisk arbeid !!