Esteu aquí: Inici > Més notícies > El català, el basc i el gallec, en risc d’extinció digital, segons un estudi de la UPC i la UPF

Notícia

Compartir Share

El 26 de setembre és el Dia Europeu de les Llengües

El català, el basc i el gallec, en risc d’extinció digital, segons un estudi de la UPC i la UPF

Tenen un suport tecnològic parcial, segons l’estudi inclòs al projecte europeu Meta-net

25/09/2012
La majoria de les llengües europees s'enfronten a l'extinció digital, segons revela un recent estudi realitzat per experts europeus en Tecnologia de la llengua. El català, gallec i el basc s’inclouen dins del conjunt de llengües d’alt risc, ja que tenen un suport tecnològic parcial.

L’estudi, que ha avaluat el suport tecnològic amb què compten 30 de les prop de 80 llengües europees, ha estat realitzat per META-NET, una xarxa europea d’excel·lència formada per 60 centres de recerca en 34 països. Aquest treball de recerca, elaborat per més de 200 experts i expertes, ha estat publicat en la sèrie de Llibres Blancs META-NET (disponibles tant en línia com en paper).

Investigadors i investigadores del Centre de Tecnologies i Aplicacions del Llenguatge i de la Parla (Talp) de la Universitat Politècnica de Catalunya•BarcelonaTech (UPC) i de l’Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra han estat responsables d’elaborar els Llibres Blancs del català, el basc i el gallec. És el primer cop que s’analitza el suport tecnològic que tenen les tres llengües, per conèixer les possibilitats que tenen de sobreviure a l’era digital.

L’estudi avalua el suport tecnològic per a cada idioma en quatre àrees diferents: la traducció automàtica, la interacció amb la veu, l'anàlisi textual i la disponibilitat de recursos lingüístics.

Diversos idiomes, com l'islandès, el letó, el lituà i el maltès, reben la puntuació més baixa en les quatre àrees, ja que tenen un suport tecnològic “feble o inexistent”. A l'altre extrem de l'espectre, i encara que no es considera que cap llengua gaudeix d’un suport "excel·lent", només l'anglès rep "un bon suport ", seguit de l'espanyol que, juntament amb el francès, l'alemany, el neerlandès i l'italià tenen un "suport tecnològic moderat". El català, el basc, i el gallec al costat d'altres llengües com el búlgar, el grec , l'hongarès i el polonès, presenten una situació de suport "parcial", la qual cosa els situa també en el conjunt de llengües d'alt risc.

En el cas del gallec i el basc, el suport tecnològic és “feble o inexistent” en una àrea, la de la traducció automàtica. De fet, 21 de les 30 llengües analitzades (70%) tenen almenys una àrea amb aquesta qualificació i es troben en perill d’extinció digital.

En català també està en alt risc, però els resultats de l’estudi pel que fa al suport en tecnologies del llenguatge són “moderadament optimistes”, segons Asunción Moreno, investigadora del TALP de la UPC. La recerca indica que s’han produït i distribuït un gran nombre de recursos lingüístics en català, si bé els productes disponibles en espanyol, i sobretot en anglès, són molt més nombrosos.

D’una banda, es ressenya que existeix una comunitat investigadora molt activa que ha estat treballant en projectes de recerca finançats pel govern de la Generalitat de Catalunya, la Generalitat Valenciana, el govern central i la Comissió Europea. Tanmateix, en l’àmbit català, com en la de la resta de llengües minoritàries, la indústria de les tecnologies de la llengua que transforma la recerca en productes és petita. Això es deu a que les llengües minoritàries no són un objectiu primordial per a les grans empreses que actualment dominen el sector.

Comparats amb altres llengües europees, el català, el gallec i el basc es situen a un nivell semblant al danès, el grec, l’hongarès o el suec, unes llengües que són idiomes oficials de països de la Unió Europea.

El llibre blanc de La llengua catalana a l’era digital es pot consultar a: http://www.meta-net.eu/whitepapers/volumes/catalan

Un suport desigual i insuficient
Aquesta recerca mostra que hi ha diferències importants en el suport que tenen les diferents llengües europees en l’àmbit de les tecnologies del llenguatge. Algunes llengües tenen una bona cobertura tant pel que fa al programari com als recursos lingüístics per a certes aplicacions, però altres idiomes, especialment els minoritaris, tenen greus deficiències en certes àrees.

"Els resultats del nostre estudi són molt alarmants. La majoria de les llengües europees no disposen dels recursos tecnològics bàsics i algunes estan abandonades gairebé del tot. En aquest sentit, cal dir que moltes de les nostres llengües no estan encara preparades per al futur. ", manifesta el professor Hans Uszkoreit, coordinador de META-NET i coeditor de l'estudi. Georg Rehm, l'altre editor de l'estudi, afegeix: "Hi ha grans diferències en el suport tecnològic que reben les diferents llengües europees. La bretxa entre les llengües 'grans' i 'petites' és cada vegada més gran. Hem d'assegurar que totes les llengües comptin amb les tecnologies bàsiques necessàries, en cas contrari aquestes llengües estan condemnades a l'extinció digital".

Programari lingüístic
La Tecnologia de la llengua produeix programari capaç de processar el llenguatge humà, ja sigui parlat o escrit. Els exemples més coneguts de programari lingüístic inclouen correctors ortogràfics i gramaticals, assistents personals interactius per telèfons intel·ligents (com Siri en l’iPhone), sistemes de diàleg telefònic, traductors automàtics, motors de cerca web i les veus sintètiques utilitzades pels sistemes de navegació GPS. Avui dia, molts d’aquests sistemes basats en tecnologies de la llengua es basen fonamentalment en mètodes estadístics que requereixen quantitats molt grans de dades. Obtenir-ne la quantitat necessària és especialment difícil per als idiomes petits, i això reverteix en l'escassa qualitat de molts sistemes estadístics, com es pot veure, per exemple, en les traduccions, sovint absurdes, produïdes pels sistemes de traducció automàtica en línia més populars, com ara Google translator, per algunes llengües.

Reptes per superar la barrera idiomàtica
Europa ha aconseguit eliminar gairebé totes les fronteres entre els països, però hi ha encara una frontera que sembla impenetrable: les barreres d’idioma, que impedeixen el lliure flux de coneixements i informació. Aquesta frontera també perjudica l'objectiu d'establir un mercat digital únic, ja que impedeix la lliure circulació de béns, productes i serveis. Les tecnologies com la traducció automàtica, resulten essencials per superar les barreres de l'idioma. Però els resultats de l'estudi de META-NET mostren clarament que molts dels idiomes europeus encara no estan preparats, degut, entre altres factors, a la manca d’investigació lingüística sistematitzada, de compromís polític i de recursos econòmics.

Cal un esforç coordinat a gran escala a Europa per omplir aquests buits i facilitar la transferència tecnològica entre les diferents llengües. Hi ha raons de pes per afrontar aquest gran repte de forma col·lectiva, en un esforç que impliqui a la Unió Europea, als Estats membres i a països associats, així com a la indústria. Una d’aquestes raons és el relativament alt cost d'aquestes tecnologies per a les comunitats lingüístiques més petites, una altra la necessitat de transferència tecnològica entre les llengües i també d'interoperabilitat entre recursos, eines i serveis, i el fet de que les fronteres lingüístiques sovint no coincideixen amb les fronteres polítiques. Europa ha de prendre mesures per preparar les seves llengües per a l'era digital. Aquestes són un component valuós del nostre patrimoni cultural i, com a tal, mereixen un futur millor.

“Les tecnologies del llenguatge són cada cop més complexes i exigeixen una gran quantitat de dades i recursos per a avançar significativament. Es necessita una coordinació entre les diferents fonts de finançament dels programes autonòmics, estatals i europeus per reduir les diferències entre les tecnologies del llenguatge dels diversos idiomes europeus”, afirma Asunción Moreno, del centre TALP de la UPC.

El 26 de setembre, el Consell d'Europa celebra el Dia Europeu de les Llengües, un dia en què es reconeix la importància de fomentar i desenvolupar el ric patrimoni lingüístic i cultural del nostre continent. El treball de META-NET és un clar recordatori dels reptes i possibilitats als quals s'enfronta el nostre patrimoni lingüístic en aquesta era de la informació.

La Tecnologia de la llengua: antecedents
La Tecnologia de la llengua ja forma part del nostre entorn quotidià, quan escrivim correus electrònics o comprem entrades per Internet. Ens ajuda quan fem recerques per Internet i quan traduïm de forma automàtica una pàgina web, quan corregim de forma automàtica un text en el nostre processador, quan utilitzem ordres de veu amb el nostre telèfon mòbil o seguim les indicacions del nostre navegador GPS. En un futur proper, podrem dialogar amb ordinadors, i fins i tot aparells domèstics, de manera natural. L'eliminació de la barrera comunicativa entre persones i màquines canviarà el nostre món.

La Tecnologia de la llengua constitueix avui en dia una de les àrees de creixement clau en la tecnologia de la informació. Les grans corporacions internacionals com Google, Microsoft, IBM i Nuance han fet inversions substancials en aquesta àrea. A Europa, centenars de petites i mitjanes empreses s'han especialitzat en determinades aplicacions o serveis. Aquesta tecnologia permet a les persones col•laborar, aprendre, fer negocis i compartir coneixements per sobre de les fronteres lingüístiques i independentment de les seves habilitats informàtiques.

La sèrie Llibres Blancs de META-NET
La sèrie Llibres Blancs de META-NET Les llengües a la Societat de la Informació europea informa sobre l'estat de 30 idiomes europeus pel que fa a la Tecnologia de la llengua i explica els riscos i les oportunitats més urgents. La sèrie abasta totes les llengües oficials dels Estats membres de la UE i altres idiomes que es parlen a Europa. Si bé ja existien estudis científics valuosos en aquest àmbit, fins ara no hi havia cap compendi exhaustiu que presentés de forma sintètica l'estat de la qüestió i els desafiaments plantejats per a cada llengua respecte al suport tecnològic d'una Europa multilingüe. Els 30 volums d'aquesta sèrie omplen aquest buit. L'estudi mostra per què la majoria dels idiomes s'enfronta a problemes greus i identifica les deficiències més greus. En total, més de 200 autors han col•laborat en la preparació dels diferents informes.
Cada volum de la sèrie està dedicat a una de les 30 llengües europees que inclou l'estudi i consta d'una versió en aquesta llengua i la seva corresponent traducció a l'anglès. Les llengües són: alemany, anglès, basc, búlgar, català, croat, danès, eslovac, eslovè, espanyol, estonià, finès, francès, gallec, grec, holandès, hongarès, irlandès, islandès, italià, letó, lituà, maltès, noruec, polonès, portuguès, romanès, serbi, suec i txec.

Sobre META-NET i META
META-NET, una xarxa d'excel·lència que consta de 60 centres de recerca en 34 països, té com a objectiu la construcció de les bases tecnològiques de la societat de la informació en una Europa multilingüe. META-NET està cofinançada per la Comissió Europea a través de quatre projectes.
META-NET està forjant META, l'Aliança Europea de Tecnologia Multilingüe. Més de 600 organitzacions de 55 països, inclosos centres de recerca, universitats, petites i mitjanes empreses, així com diverses grans empreses, ja s'han sumat a aquesta aliança.


Segueix-nos a Twitter Obriu l'enllaç en una finestra nova
És notícia
Kip S. Thorne, investit doctor 'honoris causa' per la UPC Kip S. Thorne, doctor ‘honoris causa’ per la UPC, distingit amb el Premi Nobel de Física L’astrofísic nord-americà Kip S. Thorne, doctor ‘honoris causa’ per la Universitat ... [llegir +]
La tecnologia aeroespacial del futur, aquest dissabte al CosmoCaixa La UPC i CosmoCaixa organitzen ‘Moonit’ per descobrir la tecnologia aeroespacial del futur El proper dissabte, 7 d’octubre, de 19 a 24 hores, tindrà lloc al CosmoCaixa de Barcelona la Nit ... [llegir +]
El dispositiu sense fil WOMEN-UP que es mostra a l'IOThings Solutions World Congress. Tecnologia avançada de la UPC, a l’IOT Solutions World Congress La Universitat Politècnica de Catalunya (UPC) donarà a conèixer solucions avançades en ... [llegir +]
Amb la col·laboració de:
Fundació Espanyola per a la Ciència i la Tecnologia Any de la Ciència 2007 Ministerio de Ciencia e Innovación
Aquest web utilitza cookies pròpies per oferir una millor experiència i servei. En continuar amb la navegació entenem que acceptes la nostra política de cookies Obriu l'enllaç en una finestra nova.
Oficina de Mitjans de Comunicació.
C/ Jordi Girona 31, 08034 Barcelona Tel.: +34 93 401 61 43
oficina.mitjans.comunicacio@(upc.edu)
© UPC Obriu l'enllaç en una finestra nova. Universitat Politècnica de Catalunya · BarcelonaTech