•Notícia
Sparsity, l’exploració del caos
Capacitat per donar respostes urgents a consultes complexes sobre bases de dades de més de mil milions d’objectes. Aquesta fita gairebé galàctica és un dels objectius de Sparsity, una 'spin-off' de la UPC, que ha treballat, per exemple, en la detecció de transaccions immobiliàries potencialment fraudulentes i en l’anàlisi de les causes del càncer.
23/06/2010
Sparsity és el nom de la spin-off creada recentment pel grup d’emprenedors Data Management Group (DAMA-UPC), vinculat al Departament d’Arquitectura de Computadors. El terme anglès sparsity significa "dispersió". El camp d'actuació d'aquesta jove companyia es troba en els grans volums d’informació, en la dispersió de dades en què hi ha una resposta a una pregunta concreta que només pot trobar-se explorant el caos. Sparsity treballa en aquesta galaxia d’informació. "Donem respostes a preguntes complexes, que amb un sistema relacional no es podrien oferir en un temps raonable", explica Josep Lluís Larriba, director del grup i un dels fundadors de la companyia.
L'empresa, segons Larriba, "té com a objectiu la comercialització i explotació de la propietat intel•lectual generada en el grup, tant per comercialitzar la tecnología a tercers com per desenvolupar projectes o aplicacions". Pere Baleta, Norbert Martínez i Víctor Muntès són altres fundadors de Sparsity.
El grup DAMA-UPC, explica ara Baleta, "sempre ha creat tecnologia que ha acabat esdevenint un producte". Alguns exemples d’això són l’aplicació Daurum, "per eliminar duplicitats en bases de dades", o el software DEX, "un entorn de desenvolupament basat en la tecnología de grafs que, de manera senzilla, permet identificar conjunts de registres relacionats entre si que compleixen un o més patrons".
Sparsity ha treballat, per exemple, en el camp de la detecció de transaccions immobiliàries potencialment fraudulentes i del blanqueig de diner, a través de la identificació de patrons en les transaccions de compravenda d’habitatges. Aquest projecte va ser encarregat per l’Agència Notarial de Certificació.
També ha treballat amb l’Institut Català d’Oncologia, per a l’anàlisi de les causes del càncer, explica Baleta, o "en les xarxes de relacions entre documents que s’estableixen en el món científic", amb les quals es pot representar de manera visual la relació existent entre diversos científics, detectar autoritats en una àrea de recerca o articles importants per al desenvolupament científic d’un àmbit per tal de "poder entendre millor com és el mapa de la ciència".
I quins són els plans de futur? Passen, sobretot, per l’àmbit bibliogràfic. Larriba posa un exemple: "L'Administració i editorials de revistes científiques poden estar interessades en el que fem en aquest camp. Quan el Ministeri de Ciència i Innovació obre una convocatòria per a projectes de recerca, l’Agència Nacional d’Avaluació i Prospectiva tria les persones que més coneixement tenen de la matèria del projecte perquè n’emetin un judici científic i així poder-lo avaluar. El problema és que des que s’envia el projecte fins que es decideix a qui s’assigna, cal fer molta feina mecànica de cerca". El software de Sparsity permetrà eliminar "el cost temporal d’assignar persones, que és molt elevat". En resum, el software ajuda a automatitzar processos complexos que ara per ara es fan de manera rutinària i que suposen molt de temps i molts diners.
L'empresa, segons Larriba, "té com a objectiu la comercialització i explotació de la propietat intel•lectual generada en el grup, tant per comercialitzar la tecnología a tercers com per desenvolupar projectes o aplicacions". Pere Baleta, Norbert Martínez i Víctor Muntès són altres fundadors de Sparsity.
El grup DAMA-UPC, explica ara Baleta, "sempre ha creat tecnologia que ha acabat esdevenint un producte". Alguns exemples d’això són l’aplicació Daurum, "per eliminar duplicitats en bases de dades", o el software DEX, "un entorn de desenvolupament basat en la tecnología de grafs que, de manera senzilla, permet identificar conjunts de registres relacionats entre si que compleixen un o més patrons".
Un graf i la complexitat
Un graf, que és una de les estructures matemàtiques amb les quals treballen a Sparsity, "permet representar, per exemple, xarxes socials, a les quals hi ha individus que estan relacionats entre si. En el graf, cada individu és un node i la relació que hi ha entre aquests individus és una aresta, és a dir, fa que es pugui representar la relació entre dades complexes", explica Larriba.Sparsity ha treballat, per exemple, en el camp de la detecció de transaccions immobiliàries potencialment fraudulentes i del blanqueig de diner, a través de la identificació de patrons en les transaccions de compravenda d’habitatges. Aquest projecte va ser encarregat per l’Agència Notarial de Certificació.
També ha treballat amb l’Institut Català d’Oncologia, per a l’anàlisi de les causes del càncer, explica Baleta, o "en les xarxes de relacions entre documents que s’estableixen en el món científic", amb les quals es pot representar de manera visual la relació existent entre diversos científics, detectar autoritats en una àrea de recerca o articles importants per al desenvolupament científic d’un àmbit per tal de "poder entendre millor com és el mapa de la ciència".
I quins són els plans de futur? Passen, sobretot, per l’àmbit bibliogràfic. Larriba posa un exemple: "L'Administració i editorials de revistes científiques poden estar interessades en el que fem en aquest camp. Quan el Ministeri de Ciència i Innovació obre una convocatòria per a projectes de recerca, l’Agència Nacional d’Avaluació i Prospectiva tria les persones que més coneixement tenen de la matèria del projecte perquè n’emetin un judici científic i així poder-lo avaluar. El problema és que des que s’envia el projecte fins que es decideix a qui s’assigna, cal fer molta feina mecànica de cerca". El software de Sparsity permetrà eliminar "el cost temporal d’assignar persones, que és molt elevat". En resum, el software ajuda a automatitzar processos complexos que ara per ara es fan de manera rutinària i que suposen molt de temps i molts diners.
Fitxa:
Qui: Josep Lluís Larriba, Pere Baleta, Norbert Martínez i Víctor Muntès
Quan: Març de 2010
Què: Gestió de grans volums de dades
On: Grup de recerca Data Management Group (DAMA-UPC) del Departament d’Arquitectura de Computadors de la UPC
Per a qui: Qualsevol empresa o organització que treballi amb grans volums de dades
Per a què: Transformar en respostes concretes i ràpides les preguntes a àmplies bases de dades
Qui: Josep Lluís Larriba, Pere Baleta, Norbert Martínez i Víctor Muntès
Quan: Març de 2010
Què: Gestió de grans volums de dades
On: Grup de recerca Data Management Group (DAMA-UPC) del Departament d’Arquitectura de Computadors de la UPC
Per a qui: Qualsevol empresa o organització que treballi amb grans volums de dades
Per a què: Transformar en respostes concretes i ràpides les preguntes a àmplies bases de dades
Segueix-nos a Twitter