Lunedì 23 Dicembre 2024

Ricerca sui genomi, da Google un nuovo strumento di archiviazione

ROMA. Nella massa di dati custoditi nei server di Google si trova già di tutto, dai libri ai video ai documenti caricati dagli utenti, ma c'è spazio anche per i genomi. Il nuovo servizio, dedicato almeno per ora solo ai ricercatori, va incontro alla sempre più grande massa di dati prodotta dai moderni metodi di sequenziamento, su cui anche altri big, da Amazon a Microsoft a Ibm, hanno messo gli occhi. Il progetto, ricorda la rivista del Mit Technology Review potrebbe accelerare molto il lavoro degli scienziati dando loro la possibilità di confrontare milioni di genomi, cioè tutti quelli conservati nel database e non solo quelli 'depositati' da un singolo istituto. 'Big G' ha iniziato a lavorare al progetto 18 mesi fa, costruendo le interfacce per la migrazione dei dati sui propri server e studiando come adattare gli algoritmi ora usati per le ricerche sul web a questo nuovo materiale. Il costo varierà da 25 centesimi all'anno per un genoma parziale a 25 dollari per quello completo, più alcuni costi addizionali per le elaborazioni dei dati. ''Abbiamo visto che i biologi non studiano più un genoma alla volta, ma ne vogliono esaminare milioni - spiega David Glazer, l'ingegnere a capo del progetto - l'opportunità è di applicare le innovazioni nella tecnologia dei dati per aiutare questa transizione''. La quantità di dati, sottolinea la rivista, non è tale da mettere in crisi i server delle grandi compagnie. Un istituto avanzato produce in due mesi il numero di byte che vengono caricati su Youtube in un giorno. Non tutti gli istituti però si possono permettere supercomputer o server con grandi capacità di dati, e anche quelli più grandi possono avere interesse a condividere i propri dati. E' il caso del National Cancer Institute statunitense, che ha stanziato 6,5 milioni di dollari per la migrazione di 2,6 petabyte di dati, circa un decimo del traffico mensile di Youtube, verso la 'nuvola' di Google attraverso il progetto Cancer Genomics Cloud. ''Il progetto democratizzerà l'accesso a una grande massa di dati genetici legati ai tumori - spiega Ilya Shmulevich, uno degli ideatori -. I ricercatori nel campo dei tumori analizzeranno ed esplireranno intere coorti ricche di dati genomici, senza bisogno di accedere a computer locali. Il Cgc permetterà anche ricerche collaborative più facili permettendo agli scienziati di lavorare in un ambiente cloud''.

leggi l'articolo completo