•Notícia
Proposen un sistema per analitzar la informació de Wikileaks
El Data Management Group de la UPC (DAMA-UPC) planteja fer servir la tecnologia DEX, un sistema d’exploració d'informació en forma de xarxa o graf que ha creat i patentat, per extreure informació de la xarxa Wikileaks.
28/12/2010
El Data Management Group de la Universitat Politècnica de Catalunya (DAMA-UPC) ha creat un sistema d’exploració d’informació en forma de xarxa o graf, DEX, que pot complementar els cercadors d’Internet i que té un interès especial en els camps de les xarxes socials i Internet, la biomedicina, la detecció de frau en diferents entorns, l’ensenyament i la cerca bibliogràfica avançada.
El director del grup DAMA-UPC, Josep Lluís Larriba, planteja fer servir aquesta tecnologia per extreure informació de la xarxa Wikileaks, des de dos punts de vista: per obtenir indicadors genèrics que aportin informació, per conèixer si la xarxa d'informació té les característiques d'una xarxa social o bé si es creen comunitats de dades que fan pensar en grups que aporten informació rellevant; i, d’altra banda, per analitzar com evoluciona una temàtica determinada en el temps, a través dels diferents documents allotjats a l’espai web; com es relaciona una persona o un grup de persones amb diferents temàtiques, o bé com s’interrelacionen els documents, entre d’altres aspectes.
Consultes complexes a alta velocitatLa nova tecnologia DEX patentada per la UPC permet explorar i consultar grans volums de dades en forma de xarxa. El sistema ofereix una alta velocitat de processament, l’entrada de dades configurable a partir de fonts heterogènies i la gestió de xarxes amb milers de milions de nodes i connexions, en un PC de sobretaula.
DEX permet fer consultes a partir de valors tan senzills com noms i paraules clau, de manera que l’usuari pot arribar a identificar gràficament, de forma fàcil i ràpida, registres que mantenen algun tipus de relació. Fins ara, això era possible de forma limitada amb la tecnologia en bases de dades del moment, però DEX permet extreure informació nova de les interrelacions, i millora la velocitat i la capacitat de fer consultes complexes a grans xarxes d’informació.
Ara, el Data Management Group (DAMA-UPC), que veu un gran potencial d’aplicació d’aquesta tecnologia en el camp de les xarxes socials i Internet, proposa utilitzar el sistema DEX per analitzar la informació de Wikileaks, l’organització mediàtica internacional que a través del seu web publica informes anònims i documents filtrats.
Ara, el grup DAMA-UPC està estudiant l’aplicació de la tecnologia DEX per fer una anàlisi de dades farmacèutiques, amb la finalitat de conèixer com evoluciona el consum de medicaments, entre d’altres aspectes.
En l’àmbit d’Internet, també investiguen com es propaga la informació a través de la xarxa, de quina manera i en quan de temps, i com algunes notícies es propaguen millor que altres, segons tinguin o no prescriptors d’aquesta informació. El projecte es desenvolupa en el marc del projecte Social Media, finançat com a projecte estratègic de recerca industrial, dins del programa dels Consorcis Estratègics Nacionals en Investigació Tècnica (CENIT).
En el camp de l’aprenentatge digital, estan desenvolupant un projecte, seleccionat dins el programa d’ajuts RecerCaixa, orientat a recomanar i explorar continguts audiovisuals orientats a l’ensenyament de primària i secundària.
El grup ha enginyat un prototip únic per al Ministeri de Ciència i Innovació, BIBEX (www.dama.upc.edu/bibex), per explorar el món de les publicacions científiques i relacionar bibliografia específica publicada en l’àmbit internacional. BIBEX ofereix altres avantatges als científics: permet cercar persones revisores per a l’avaluació de publicacions científiques i permet recomanar articles en àrees científiques. En el futur, BIBEX oferirà al món de l’empresa un bon instrument per detectar grups científics d’interès en camps comuns de recerca.
El director del grup DAMA-UPC, Josep Lluís Larriba, planteja fer servir aquesta tecnologia per extreure informació de la xarxa Wikileaks, des de dos punts de vista: per obtenir indicadors genèrics que aportin informació, per conèixer si la xarxa d'informació té les característiques d'una xarxa social o bé si es creen comunitats de dades que fan pensar en grups que aporten informació rellevant; i, d’altra banda, per analitzar com evoluciona una temàtica determinada en el temps, a través dels diferents documents allotjats a l’espai web; com es relaciona una persona o un grup de persones amb diferents temàtiques, o bé com s’interrelacionen els documents, entre d’altres aspectes.
Consultes complexes a alta velocitat
DEX permet fer consultes a partir de valors tan senzills com noms i paraules clau, de manera que l’usuari pot arribar a identificar gràficament, de forma fàcil i ràpida, registres que mantenen algun tipus de relació. Fins ara, això era possible de forma limitada amb la tecnologia en bases de dades del moment, però DEX permet extreure informació nova de les interrelacions, i millora la velocitat i la capacitat de fer consultes complexes a grans xarxes d’informació.
Ara, el Data Management Group (DAMA-UPC), que veu un gran potencial d’aplicació d’aquesta tecnologia en el camp de les xarxes socials i Internet, proposa utilitzar el sistema DEX per analitzar la informació de Wikileaks, l’organització mediàtica internacional que a través del seu web publica informes anònims i documents filtrats.
De la detecció de frau a l’evolució del càncer
L’aplicació pionera de DEX ha estat, a través de l’Agència Notarial de Certificació, la detecció de frau en les operacions de compravenda de béns immobles. L’Institut Català d’Oncologia també el fa servir actualment en l’estudi de l’evolució del càncer a Catalunya. Ara, el grup DAMA-UPC està estudiant l’aplicació de la tecnologia DEX per fer una anàlisi de dades farmacèutiques, amb la finalitat de conèixer com evoluciona el consum de medicaments, entre d’altres aspectes.
En l’àmbit d’Internet, també investiguen com es propaga la informació a través de la xarxa, de quina manera i en quan de temps, i com algunes notícies es propaguen millor que altres, segons tinguin o no prescriptors d’aquesta informació. El projecte es desenvolupa en el marc del projecte Social Media, finançat com a projecte estratègic de recerca industrial, dins del programa dels Consorcis Estratègics Nacionals en Investigació Tècnica (CENIT).
En el camp de l’aprenentatge digital, estan desenvolupant un projecte, seleccionat dins el programa d’ajuts RecerCaixa, orientat a recomanar i explorar continguts audiovisuals orientats a l’ensenyament de primària i secundària.
Explorar la informació científica
A banda dels àmbits de la salut, la detecció del frau, l’ensenyament i Internet, la tecnologia del grup DAMA-UPC també aporta beneficis en el món científic.El grup ha enginyat un prototip únic per al Ministeri de Ciència i Innovació, BIBEX (www.dama.upc.edu/bibex), per explorar el món de les publicacions científiques i relacionar bibliografia específica publicada en l’àmbit internacional. BIBEX ofereix altres avantatges als científics: permet cercar persones revisores per a l’avaluació de publicacions científiques i permet recomanar articles en àrees científiques. En el futur, BIBEX oferirà al món de l’empresa un bon instrument per detectar grups científics d’interès en camps comuns de recerca.
Transferència de tecnologia
Amb la finalitat de donar major difusió i comercialtzar aquestes tecnologies desenvolupades per el grup DAMA-UPC, aquest any 2010 han creat l’empresa spin-off Sparsity Technologies, amb participació de la UPC.Segueix-nos a Twitter
