Si apre unanuova era per la biologiaconEvo2, ilpiù potente modellodiintelligenza artificiale generativaapplicato allagenetica. E'una sorta di ChatGptaddestrato a comprendere il Dnapiuttosto che il linguaggio umano:può analizzare e riscrivere intere sequenze di codice genetico,identificare mutazioni all'origine di malattieeprogettare nuovi genomi(lunghi quanto quelli di semplicibatteri). Istruito con9 mila miliardi di 'lettere' del Dna(nucleotidi) provenienti da128mila genomidispecie diverse,vive ed estinte, è stato sviluppato dall'Arc Institute e da Nvidia, insieme alla Stanford University e all'Università della California a Berkeley e San Francisco. Il risultato del loro lavoro, rilasciato un anno fa, è ora pubblicato anche sulla rivista Nature.

Se il modello precedente Evo 1 (presentato nel 2024)era statoaddestrato interamente su genomi diorganismi unicellulari,Evo 2si basa anche su genomi diorganismi pluricellulari, compresiesseri umani e piante. In questo modopuò elaborare sequenze genetiche fino a 1 milione di nucleotidi contemporaneamente, arrivando a comprendere anche lerelazioni nascosteche intercorronotra parti distanti di un genoma.

"Il nostro sviluppo di Evo 1 ed Evo 2 rappresenta unmomento chiavenel campo emergente dellabiologia generativa, perchéha permesso alle macchine di leggere, scrivere e pensare nel linguaggio dei nucleotidi", osserva Patrick Hsu, co-fondatore dell'Arc Institute. "Evo 2 ha una comprensione generalista dell'albero della vita che èutile per una moltitudine di compiti, dallaprevisione di mutazioniche causanomalattie allaprogettazione di potenziali codiciper lavita artificiale".

Evo2 mostra già unaversatilità sufficiente aidentificare i cambiamenti geneticiche influenzano lafunzione delle proteine: ad esempio, nei test convarianti delgene Brca1associato altumore del seno, Evo 2 ha raggiunto un'accuratezza superiore al 90%nelpredire le mutazioni benigne rispetto a quelle potenzialmente pericolose. Intuizioni come queste potrebbero far risparmiare ore di lavoro e fondi per la ricerca necessari per condurre esperimenti su cellule o animali, individuando le cause genetiche delle malattie umane e accelerando lo sviluppo di nuovi farmaci e terapie geniche mirate con minori effetti collaterali.

Si tratta dunque di uno strumento potentissimo che si inserisce in unpercorso nato dalle scoperte sull'editing genetico(la tecnica Crispr che è valsa il Premio Nobel per la chimica 2020 a Emmanuelle Charpentier e Jennifer Doudna) e proseguito poi con AlphaFold , l'Ia di Google capace di prevedere lastruttura tridimensionaledelleproteine e di crearne di nuove, non presenti in natura.Evo 2 estende ulteriormente queste capacitàe trovaapplicazione in molti nuovi settori, come laprogettazione di sequenze genetiche inedite, l'interpretazione di frammenti di Dnadi cui è difficile capire la funzione, e ancora lo studio della genesi di malattieereditarie. Un esempio delle sue potenzialità era stato mostrato nelsettembre 2024, quando il gruppo di ricerca guidato da Brian Hie dell'Università di Stanford aveva usato Evo 2 per realizzare per la prima volta un intero virus in laboratorio.Potenzialità senza precedentiche proprioper questioni etiche sono state limitate,impedendo a Evo 2 di modificare o progettare organismi potenzialmente pericolosi.