•Notícia
En col·laboració amb altres universitats i centres de recerca europeus
Investiguen un sistema per comparar el rendiment de la tecnologia de bases de dades
L’objectiu del projecte és crear, per primer cop, mesures de rendiment, també anomenats ‘benchmarks’, que serveixin per validar la tecnologia que s’aplica per gestionar les bases de dades RDF i de grafs a Facebook, Twitter o en els blogs.
14/01/2013
El grup de recerca Data Management Group (DAMA-UPC) de la Universitat Politècnica de Catalunya · BarcelonaTech (UPC) coordina el projecte europeu Linked Data Benchmark Council (LDBC), del setè Programa marc de la Unió Europea. L’objectiu és desenvolupar benchmarks (mesures de rendiment) per avaluar de manera estàndard, per primer cop, la tecnologia de gestió de bases de dades RDF i grafs. Aquestes bases de dades són les que es fan servir, per exemple, en aplicacions relacionades amb les xarxes socials (Facebook, Twitter, blogs…).
En el projecte, que té un pressupost global d’uns 3 milions d’euros, hi participa un consorci format per vuit universitats i centres de recerca europeus, liderats pel grup DAMA-UPC. Els resultats de LDBC seran un conjunt de benchmarks que abastaran quatre àrees principals de la gestió Linked Data: execució de consultes analítiques complexes, transaccionalitat en els grafs, inferència i integració de dades.
L’anàlisi de xarxes socials i de xarxes d’informació biològica, així com l’exploració bibliogràfica són alguns dels principals àmbits d’interès del projecte i de l’aplicació de benchmarks.
La tecnologia i l'ample de banda han proporcionat l’oportunitat de recopilar, publicar i compartir en línia grans quantitats de conjunts de dades, formats per milers de milions d’objectes i connexions entre ells. Actualment es publiquen com a grafs RDF nombrosos conjunts de dades i vocabularis d'e-ciència, amb la finalitat de facilitar a la comunitat científica dades científiques i acadèmiques d'interès. Per tant, existeix un bon nombre de gestors comercials (bases de dades RDF amb raonador i motor consulta o gestors de grafs) que són la pedra angular de la web semàntica.
Tanmateix, no existeix un sistema validat per valorar de manera quantitativa i qualitativa, per exemple, la rapidesa i l’eficàcia d’un software, d’una cerca a una base o d’altres prestacions de la tecnologia informàtica que hi ha al mercat en el camp de la integració i la gestió de bases de dades, és a dir RDF i graf. El projecte Linked Data Benchmark Council l (LDBC) té com a objectiu proporcionar una solució en aquest sentit abans dels propers tres anys: els benchmarks que es desenvolupin en el marc del projecte serviran per poder avaluar i comparar les diferents tecnologies i determinar quina és la millor.
Alhora, el projecte ofereix una oportunitat per impulsar la innovació, el progrés i la competitivitat de la indústria del graf i la gestió de dades RDF, atès que els benchmarks serviran com a eina o banc de proves per comparar els productes de diferents competidors; les empreses podran posar a prova i millorar la tecnologia que desenvolupen gràcies als reptes proposats per aquests benchmarks.
Segons afirma Pere Baleta, del grup DAMA-UPC, “l’existència de benchmarks validats per auditors imparcials permetrà que les empreses que comprin tecnologies existents tinguin arguments objectius per fer una elecció més fiable”.
En el projecte, que té un pressupost global d’uns 3 milions d’euros, hi participa un consorci format per vuit universitats i centres de recerca europeus, liderats pel grup DAMA-UPC. Els resultats de LDBC seran un conjunt de benchmarks que abastaran quatre àrees principals de la gestió Linked Data: execució de consultes analítiques complexes, transaccionalitat en els grafs, inferència i integració de dades.
L’anàlisi de xarxes socials i de xarxes d’informació biològica, així com l’exploració bibliogràfica són alguns dels principals àmbits d’interès del projecte i de l’aplicació de benchmarks.
Validar la millor tecnologia
En els últims anys hi ha hagut una explosió de grans quantitats de dades en forma de graf que provenen d’una gran varietat d’aplicacions relacionades amb les xarxes socials, com ara Facebook, Twitter, blogs i altres mitjans on line, amb xarxes de telecomunicacions, i dades d’altres aplicacions. A més, la comunitat internacional World Wide Web Consortium (W3C) —que desenvolupa estàndards que asseguren el creixement de la Web a llarg termini— ha impulsat la publicació i la interconnexió d’un gran nombre de conjunts de dades en la web semàntica, com a resultat del Linked Data Cloud. La tecnologia i l'ample de banda han proporcionat l’oportunitat de recopilar, publicar i compartir en línia grans quantitats de conjunts de dades, formats per milers de milions d’objectes i connexions entre ells. Actualment es publiquen com a grafs RDF nombrosos conjunts de dades i vocabularis d'e-ciència, amb la finalitat de facilitar a la comunitat científica dades científiques i acadèmiques d'interès. Per tant, existeix un bon nombre de gestors comercials (bases de dades RDF amb raonador i motor consulta o gestors de grafs) que són la pedra angular de la web semàntica.
Tanmateix, no existeix un sistema validat per valorar de manera quantitativa i qualitativa, per exemple, la rapidesa i l’eficàcia d’un software, d’una cerca a una base o d’altres prestacions de la tecnologia informàtica que hi ha al mercat en el camp de la integració i la gestió de bases de dades, és a dir RDF i graf. El projecte Linked Data Benchmark Council l (LDBC) té com a objectiu proporcionar una solució en aquest sentit abans dels propers tres anys: els benchmarks que es desenvolupin en el marc del projecte serviran per poder avaluar i comparar les diferents tecnologies i determinar quina és la millor.
Alhora, el projecte ofereix una oportunitat per impulsar la innovació, el progrés i la competitivitat de la indústria del graf i la gestió de dades RDF, atès que els benchmarks serviran com a eina o banc de proves per comparar els productes de diferents competidors; les empreses podran posar a prova i millorar la tecnologia que desenvolupen gràcies als reptes proposats per aquests benchmarks.
Segons afirma Pere Baleta, del grup DAMA-UPC, “l’existència de benchmarks validats per auditors imparcials permetrà que les empreses que comprin tecnologies existents tinguin arguments objectius per fer una elecció més fiable”.
Entitat validadora
En el marc del projecte també es crearà la fundació LDBC, una entitat oficial per validar i potenciar el desenvolupament de benchmarks per a bases de dades RDF i de grafs.Segueix-nos a Twitter
