•Notícia
Barcelona, nova seu de l'Arxiu Europeu del Genoma-Fenoma (EGA), un recurs fonamental per a la investigació biomèdica
El BSC-CNS emmagatzemarà les dades de l’Arxiu Europeu del Genoma-Fenoma
El Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) albergarà les dades de l’Arxiu Europeu de Genomes i Fenomes (EGA), que emmagatzema dades de 100.000 persones generades per més de 700 estudis científics sobre diverses malalties, procedents de 200 centres i grups de recerca de tot el món. Les dades (un milió de Gigabytes) seran analitzades amb el supercomputador MareNostrum.
15/05/2014
L’Arxiu Europeu del Genoma-Fenoma (EGA), que tindrà la seu a Barcelona, és un projecte liderat pel Centre de Regulació Genòmica (CRG), en el qual participa el BSC-CNS. El projecte s’ha presentat el 14 de maig, al Palau Macaya de Barcelona, a càrrec de Carmen Vela, secretària d’Estat d’R+D+i del Ministeri d’Economia i Competitivitat; Andreu Mas-Colell, conseller d’Economia i Coneixement de la Generalitat de Catalunya, i Jaime Lanaspa, director general de la Fundació ‘la Caixa’, juntament amb Luis Serrano, director del CRG, i Arcadi Navarro, cap afiliat de l’equip de l’EGA.
L’EGA és la forma de garantir que les dades de genomes i fenomes, l’obtenció de les quals és notablement cara, es posen a disposició de la comunitat científica mundial, de manera que les investigacions es puguin accelerar i tinguin lloc nous descobriments. Així mateix, l’EGA és la resposta europea al repte sorgit de la necessitat de protegir la privacitat de les persones donants que han participat en estudis genòmics.
Janet Thornton, directora de l’Institut Europeu de Bioinformàtica (EBI, de l’anglès European Bioinformatics Institute) i defensora de la infraestructura europea de bioinformàtica ELIXIR; Alfonso Valencia, director de l’Institut Nacional de Bioinformàtica de l’Institut de Salut Carles III (INB-ISCIII), i Roderic Guigó, coordinador del programa d’investigació Bioinformàtica i Genòmica del CRG, i professor de la Universitat Pompeu Fabra (UPF), van començar a explorar fa un temps la possibilitat de compartir l’EGA i d’instal·lar una còpia d’aquesta base de dades al CRG. Tots tres van estar d’acord que en l’entorn de les xarxes de col·laboració europees, i en concret dins la infraestructura ELIXIR, aquesta iniciativa seria millor i més forta.
Més endavant, el CRG i el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) —entitat de recerca vinculada a la Universitat Politècnica de Catalunya · BarcelonaTech (UPC)—, van acordar que les dades s’emmagatzemarien físicament a les instal·lacions del BSC, centre que també col·laborarà en l’anàlisi de dades amb el superordinador MareNostrum i el treball d’investigadors del centre. Actualment, l’equip EGA-CRG està constituït per sis persones i liderat per Arcadi Navarro, cap afiliat de l’equip, professor ICREA i director del Departament de Ciències Experimentals i de la Salut de la UPF, i per un dels directors de l’INB-ISCIII.
La posada en marxa d’aquesta iniciativa és fruit del treball conjunt de nombroses entitats, a més del CRG, entre les quals hi ha l’Obra Social ”la Caixa”, el Ministeri d’Economia i Competitivitat a través del programa Centres d’Excel·lència Severo Ochoa, la Generalitat de Catalunya, el BSC-CNS, l’INB-ISCIII, el consorci ELIXIR i l’EBI-EMBL. També ha contribuït a l’establiment de l’EGA el seu desenvolupament com a projecte pilot al si de la infraestructura europea ELIXIR.
En essència, l’EGA conté dades confidencials relatives a informació sobre variants genòmiques portades per persones que presenten fenotips de malalties i per persones sanes. La informació recollida procedeix exclusivament de persones el consentiment de les quals autoritza la publicació de les dades per utilitzar-les en el marc d’investigacions científiques o per a científics registrats.
Les dades emmagatzemades a l’EGA fan referència a més de 100.000 persones que en la major part dels casos pateixen malalties complexes. Es tracta de malalties amb un gran impacte en la salut pública, incloent-hi molts tipus de càncer (de mama, de colon), malalties autoimmunes (esclerosi múltiple o diabetis), malalties cardiovasculars o psiquiàtriques, entre d’altres 50 patologies diferents.
L’EGA arxiva de forma permanent diversos nivells de dades obtingudes mitjançant diferents tecnologies, incloent-hi dades de seqüenciació sense processar (que, per exemple, es podrien reanalitzar en el futur mitjançant altres mètodes o algorismes), a més de les variants genòmiques finals proporcionades pels sol·licitants. L’EGA s’ha dissenyat com a repositori de tota mena d’experiments de seqüenciació, epigenètica i genotipatge, incloent-hi estudis de control de casos, població i familiars.
Totes aquestes dades han estat generades per grups d’investigació i consorcis i institucions no tan sols europeus, sinó d’arreu del món, com ara el Wellcome Trust (Regne Unit), l’International Cancer Genome Consortium (ICGC, amb participació espanyola), la Universitat de Tòquio (Japó), la Universitat de Beijing (Xina), la Universitat de Harvard (Estats Units), la Universitat de Ginebra (Suïssa), la British Columbia Cancer Agency (Canadà) i fins a un total de més de 140 institucions internacionals. Totes aquestes entitats han confiat les seves dades a l’EGA per garantir-ne la seguretat i l’explotació en benefici de la salut humana.
Només durant els primers quatre mesos del 2014, les dades emmagatzemades a l’EGA s’han transferit més de 20.000 vegades a gairebé 5.000 usuaris de grups d’investigació dels cinc continents. D’aquesta manera, l’EGA garanteix que tota la comunitat científica pugui disposar d’aquestes valuoses dades per dur a terme treballs d’investigació que d’una altra manera serien impossibles.
Actualment, el volum total de les dades, una vegada comprimides, és d’aproximadament 1 PB (1 milió de GB). Els últims 12 mesos, el catàleg EGA ha experimentat un creixement del 50% en el nombre d’estudis i del 70% en el nombre d’arxius. Es preveu que els pròxims 12 mesos el volum total d’arxius es multipliqui per tres.
“L’EGA és, entre altres coses, una infraestructura necessària per garantir que les dades òmiques finançades amb fons públics s’emmagatzemen de forma adequada, es distribueixen àgilment i s’analitzen exhaustivament”, explica Arcadi Navarro. Els seus continguts són, segons Navarro, “fonamentals per maximitzar els beneficis obtinguts de les inversions en genòmica, que ja s’han convertit en un recurs clau i estratègic per possibilitar el desenvolupament de la medicina de sistemes personalitzada. Només a través de l’EGA, Europa podrà mantenir la seva posició de lideratge en la investigació biomèdica”, afirma Arcadi Navarro. “Per això, l’objectiu d’EGA-CRG no és ser únicament una còpia de seguretat, sinó proporcionar més recursos (infraestructura i talent) a tot el projecte EGA, per ajudar a millorar i ampliar les seves funcionalitats”, indica Navarro.
“L’EGA representa un enorme valor afegit al ja excepcional clúster d’investigació en genòmica i salut de Barcelona, que inclou institucions líders com el BSC-CNS, el Centre Nacional d’Anàlisi Genòmica (CNAG), l’Institut de Recerca Biomèdica (IRB), el CRG i moltes més, algunes de les quals són membres de la Global Alliance for Genomics and Health, una iniciativa d’abast mundial amb uns objectius que encaixen perfectament en la missió de l’EGA. D’una manera molt significativa, l’EGA és un magnífic exemple de com una bona mostra de diferents instituts nacionals pot unir esforços per assolir un objectiu comú. La innovació no s’atura per la recessió”, afirma Luis Serrano, director del CRG. “L’EGA impulsarà la marca Barcelona com a ciutat de referència en l’anàlisi dels genomes i la seva relació amb les malalties. A més, al voltant de l’EGA es desenvoluparan noves eines bioinformàtiques que ens permetran avançar en el camp de la medicina personalitzada”, conclou Serrano.
L’EGA és la forma de garantir que les dades de genomes i fenomes, l’obtenció de les quals és notablement cara, es posen a disposició de la comunitat científica mundial, de manera que les investigacions es puguin accelerar i tinguin lloc nous descobriments. Així mateix, l’EGA és la resposta europea al repte sorgit de la necessitat de protegir la privacitat de les persones donants que han participat en estudis genòmics.
Janet Thornton, directora de l’Institut Europeu de Bioinformàtica (EBI, de l’anglès European Bioinformatics Institute) i defensora de la infraestructura europea de bioinformàtica ELIXIR; Alfonso Valencia, director de l’Institut Nacional de Bioinformàtica de l’Institut de Salut Carles III (INB-ISCIII), i Roderic Guigó, coordinador del programa d’investigació Bioinformàtica i Genòmica del CRG, i professor de la Universitat Pompeu Fabra (UPF), van començar a explorar fa un temps la possibilitat de compartir l’EGA i d’instal·lar una còpia d’aquesta base de dades al CRG. Tots tres van estar d’acord que en l’entorn de les xarxes de col·laboració europees, i en concret dins la infraestructura ELIXIR, aquesta iniciativa seria millor i més forta.
Més endavant, el CRG i el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) —entitat de recerca vinculada a la Universitat Politècnica de Catalunya · BarcelonaTech (UPC)—, van acordar que les dades s’emmagatzemarien físicament a les instal·lacions del BSC, centre que també col·laborarà en l’anàlisi de dades amb el superordinador MareNostrum i el treball d’investigadors del centre. Actualment, l’equip EGA-CRG està constituït per sis persones i liderat per Arcadi Navarro, cap afiliat de l’equip, professor ICREA i director del Departament de Ciències Experimentals i de la Salut de la UPF, i per un dels directors de l’INB-ISCIII.
La posada en marxa d’aquesta iniciativa és fruit del treball conjunt de nombroses entitats, a més del CRG, entre les quals hi ha l’Obra Social ”la Caixa”, el Ministeri d’Economia i Competitivitat a través del programa Centres d’Excel·lència Severo Ochoa, la Generalitat de Catalunya, el BSC-CNS, l’INB-ISCIII, el consorci ELIXIR i l’EBI-EMBL. També ha contribuït a l’establiment de l’EGA el seu desenvolupament com a projecte pilot al si de la infraestructura europea ELIXIR.
Dades sobre malalties complexes
Fins ara, l’EGA ha constituït un servei de l’EBI-EMBL. La seva finalitat consisteix a arxivar de manera permanent i segura, i compartir de forma controlada, tota mena de dades genòmiques i fenotípiques de persones identificables, resultants de projectes d’investigació biomèdica, especialment de projectes relacionats amb malalties complexes.En essència, l’EGA conté dades confidencials relatives a informació sobre variants genòmiques portades per persones que presenten fenotips de malalties i per persones sanes. La informació recollida procedeix exclusivament de persones el consentiment de les quals autoritza la publicació de les dades per utilitzar-les en el marc d’investigacions científiques o per a científics registrats.
Les dades emmagatzemades a l’EGA fan referència a més de 100.000 persones que en la major part dels casos pateixen malalties complexes. Es tracta de malalties amb un gran impacte en la salut pública, incloent-hi molts tipus de càncer (de mama, de colon), malalties autoimmunes (esclerosi múltiple o diabetis), malalties cardiovasculars o psiquiàtriques, entre d’altres 50 patologies diferents.
L’EGA arxiva de forma permanent diversos nivells de dades obtingudes mitjançant diferents tecnologies, incloent-hi dades de seqüenciació sense processar (que, per exemple, es podrien reanalitzar en el futur mitjançant altres mètodes o algorismes), a més de les variants genòmiques finals proporcionades pels sol·licitants. L’EGA s’ha dissenyat com a repositori de tota mena d’experiments de seqüenciació, epigenètica i genotipatge, incloent-hi estudis de control de casos, població i familiars.
Totes aquestes dades han estat generades per grups d’investigació i consorcis i institucions no tan sols europeus, sinó d’arreu del món, com ara el Wellcome Trust (Regne Unit), l’International Cancer Genome Consortium (ICGC, amb participació espanyola), la Universitat de Tòquio (Japó), la Universitat de Beijing (Xina), la Universitat de Harvard (Estats Units), la Universitat de Ginebra (Suïssa), la British Columbia Cancer Agency (Canadà) i fins a un total de més de 140 institucions internacionals. Totes aquestes entitats han confiat les seves dades a l’EGA per garantir-ne la seguretat i l’explotació en benefici de la salut humana.
Només durant els primers quatre mesos del 2014, les dades emmagatzemades a l’EGA s’han transferit més de 20.000 vegades a gairebé 5.000 usuaris de grups d’investigació dels cinc continents. D’aquesta manera, l’EGA garanteix que tota la comunitat científica pugui disposar d’aquestes valuoses dades per dur a terme treballs d’investigació que d’una altra manera serien impossibles.
Actualment, el volum total de les dades, una vegada comprimides, és d’aproximadament 1 PB (1 milió de GB). Els últims 12 mesos, el catàleg EGA ha experimentat un creixement del 50% en el nombre d’estudis i del 70% en el nombre d’arxius. Es preveu que els pròxims 12 mesos el volum total d’arxius es multipliqui per tres.
Avenç en la medicina
Per regular la manera com l’equip de l’EGA gestiona aquesta informació, i com s’emmagatzema i es distribueix de forma segura, hi ha uns protocols estrictes supeditats a comitès d’accés de dades (DAC, de l’anglès Data Access Committee) independents. Actualment, l’EGA conté dades de gairebé 800 estudis.“L’EGA és, entre altres coses, una infraestructura necessària per garantir que les dades òmiques finançades amb fons públics s’emmagatzemen de forma adequada, es distribueixen àgilment i s’analitzen exhaustivament”, explica Arcadi Navarro. Els seus continguts són, segons Navarro, “fonamentals per maximitzar els beneficis obtinguts de les inversions en genòmica, que ja s’han convertit en un recurs clau i estratègic per possibilitar el desenvolupament de la medicina de sistemes personalitzada. Només a través de l’EGA, Europa podrà mantenir la seva posició de lideratge en la investigació biomèdica”, afirma Arcadi Navarro. “Per això, l’objectiu d’EGA-CRG no és ser únicament una còpia de seguretat, sinó proporcionar més recursos (infraestructura i talent) a tot el projecte EGA, per ajudar a millorar i ampliar les seves funcionalitats”, indica Navarro.
“L’EGA representa un enorme valor afegit al ja excepcional clúster d’investigació en genòmica i salut de Barcelona, que inclou institucions líders com el BSC-CNS, el Centre Nacional d’Anàlisi Genòmica (CNAG), l’Institut de Recerca Biomèdica (IRB), el CRG i moltes més, algunes de les quals són membres de la Global Alliance for Genomics and Health, una iniciativa d’abast mundial amb uns objectius que encaixen perfectament en la missió de l’EGA. D’una manera molt significativa, l’EGA és un magnífic exemple de com una bona mostra de diferents instituts nacionals pot unir esforços per assolir un objectiu comú. La innovació no s’atura per la recessió”, afirma Luis Serrano, director del CRG. “L’EGA impulsarà la marca Barcelona com a ciutat de referència en l’anàlisi dels genomes i la seva relació amb les malalties. A més, al voltant de l’EGA es desenvoluparan noves eines bioinformàtiques que ens permetran avançar en el camp de la medicina personalitzada”, conclou Serrano.
Segueix-nos a Twitter