Lestrutture molecolaridi milioni dicomplessi proteici sono stateaggiunteal grande database pubblico di AlphaFold, il sistema di intelligenza artificiale sviluppato daGoogle DeepMind perprevederelastrutturadelleproteine.Questo ampio aggiornamento, focalizzato sullemolecole più rilevantiper labiologia umanae le malattie (compresi i batteri considerati prioritari dall'Organizzazione mondiale della sanità), punta ad accelerare la ricerca scientifica contribuendo ad affrontare le grandi sfide sanitarie a livello globale. Il risultato è frutto di unacollaborazione internazionale con l'Istituto europeo di bioinformatica del Laboratorio europeo di biologia molecolare (Embl-Ebi), Nvidia e l'Università nazionale di Seul in Corea del Sud. 

Questo è il primo passo di un ambizioso progettoche mira ad aggiungere un'ampiagamma di previsionisullastrutturadei complessi proteici al database AlphaFold. La collaborazione ha già calcolatoprevisioni per 30 milioni di complessi.Di questi,1,7 milioni di previsioni diomodimeri(ovvero complessi proteici formati da due proteine ​​identiche) adalta affidabilitàsono stateaggiunte al database. Altri18 milioni sonoomodimeri a minore affidabilità, disponibili in un elenco e per il download in blocco. I restanti sonoeterodimeri (ovvero complessi proteici formati da subunità diverse), attualmente in fase di analisi e valutazione. Nei prossimi mesi verranno calcolate ulteriori previsioni di complessi proteici e verranno aggiunte al database AlphaFold previsioni ad alta affidabilità. Il lavoro è descritto in modo più dettagliato in un articolo non ancora sottoposto a revisione fra pari (preprint).

“Ilgenoma umanocontiene poco più di20.000 proteine ​​diverse", spiega Dame Janet Thornton, direttrice emerita dell'Embl-Ebi. "Nonostante questo genoma relativamentepiccolo, gli esseri umani presentano vie biologiche, processi e meccanismi di regolazione incredibilmentecomplessi". L'aggiornamento del database AlphaFold "rappresenta unprimo passo versounadescrizione completadell'interattoma umano", cioè l’insiemedi tutte le interazioni molecolari che avvengono nell'organismo, "la base su cui verrà descritta e compresa la biologia umana. Ciò - continua Dame Janet Thornton - ha rilevanza per laprogettazionedinuove terapie, lacomprensionedelle interazioni ospite-patogenoe altro ancora. Rendere queste strutture accessibili a tutti permette a ogni ricercatore del mondo di basarsi su questi dati, facendo un passo avanti verso la previsione della biologia della vita”.