•Notícia
La Politècnica treballa en la creació del primer macrodiccionari informàtic multilingüe en castellà, italià, holandès i anglès.
El programa serà una eina d'ús públic, molt útil per a la recerca, el filtrat i el desviament d'informació.
Un grup de treball del Departament de Llenguatges i Sistemes Informàtics, encapçalat per Horacio Rodríguez, participa en la creació de la primera gran base informàtica de coneixement lèxic multinlingüe, per a programes de tractament de textos i per a consulta manual. És el projecte Eurowordnet, una base de dades en castellà, italià, holandès i anglès, en el qual hi treballen també les universitats de Barcelona, d'Amsterdam, de Sheffield, la UNED, l'Institut de Lingüística Computacional de Pisa i l'empresa Novell Belgium.
El projecte, inclós en el programa d'Aplicacions Telemàtiques de la Unió Europea, parteix del Wordnet ja existent en anglès i creat l'any 1987 per la universitat nord-americana de Princeton. Amb un total de 80.000 entrades de mots, aquesta és la base informàtica de coneixement lèxic més important del món. L'Eurowordnet pretèn ampliar el programa a les tres llengües esmentades.
Experts en informàtica de la Politècnica i de la UNED, juntament amb lingüistes de la UB, estan creant el diccionari en castellà, que tindrà 50.000 entrades de mots (noms i verbs), com en les altres llengües, amb definicions lèxiques i també semàntiques (per la seva relació de sinonímia, antonímia, hiponímia, hiperonímia, etc.). La informació proporcionada a través de diccionaris monolingües i bilingües i una sèrie de tècniques informàtiques són la base per dur a terme el projecte.
L'Eurowordnet serà una eina d'us públic, molt útil no només per a la recerca d'informació, sinó per als processos de filtrat i de desviament d'informació.
D'altra banda, la Generalitat de Catalunya està estudiant la proposta feta pel mateix equip de la UPC de crear unWordnet en llengua catalana.
Segueix-nos a Twitter
