•Notícia
El primer prototipus estarà llest al juliol i serà la primera aplicació per traduir emissions de ràdio i TV i text en totes les llengües de l’Estat i en anglès
Creat el primer sistema multilingüe de cerca i traducció de continguts audiovisuals
El Grup de Tractament de la Parla (VEU) de la UPC ha creat la primera aplicació informàtica que tradueix automàticament emissions de ràdio, televisió i text en totes les llengües de l’Estat espanyol i en anglès. L’objectiu del projecte, anomenat BUCEADOR, és millorar les tecnologies i sistemes de reconeixement automàtic de la parla, la traducció i la síntesi de veu.
01/06/2011
El sistema desenvolupat en el marc del projecte BUCEADOR, liderat pel grup de recerca VEU de la Universitat Politècnica de Catalunya (UPC), permet realitzar cerques i traduccions per a arxius de vídeo, àudio i documents de text en castellà, català, basc, gallec i anglès.
Amb el nou sistema, el resultat de la cerca d’un vídeo o un àudio és un document, bé amb la veu traduïda i sintetitzada en l’idioma que es desitgi, bé subtitulat en un altre idioma. En cas que el document buscat tingui format text, el resultat podrà ser igualment un text i també un arxiu d’àudio en l’idioma de traducció escollit.
Aquesta aplicació és la primera que tradueix emissions de ràdio, televisió i text en totes les llengües de l’Estat espanyol, a més de l’anglès. “Pot traduir una emissió de televisió en basc al català en àudio i en text. A més, permet que la paraula de cerca es pugui introduir en qualsevol d’aquests idiomes i obtenir resultats per als mateixos idiomes”, explica Asunción Moreno, coordinadora de BUCEADOR.
El projecte, liderat per la UPC, es desenvolupa en el marc del Pla Nacional d’R+D+i amb la participació de les universitats del País Basc i de Vigo, i amb el suport de Barcelona Media. En l’equador de la recerca, que finalitzarà el 2012, ara s’està desenvolupant un prototipus que estarà llest al juliol.
L’objectiu final del projecte és millorar les tecnologies i sistemes de reconeixement automàtic de la parla, la traducció i la síntesi de veu. Tot i que l’aplicació està pensada per ser emprada a la indústria audiovisual, “el sistema pot convertir-se en un buscador que posi a l’abast de tothom imatges en moviment, fotografies i textos associats a una paraula i els pugui traduir a qualsevol idioma”, preveu Moreno.
Els sistemes de traducció emprats per la UPC són estadístics, ja que, com el traductor de Google o el N-II —traductor automàtic per a castellà, català i anglès desenvolupat pel Grup VEU de la UPC, són idonis per traduir la parla. Superen els sistemes basats en regles perquè són capaços de resoldre traduccions de paraules lligades, aprenen de les traduccions i se’ls pot entrenar per especialitzar-los en registres o àmbits específics. En traduccions que depenen del context, com és el cas de la paraula ‘porter’, aquests traductors són capaços de discernir si parlem del ‘porter’ de futbol o del ‘porter’ d’un edifici.
Les traduccions desenvolupades per la UPC segueixen el procés següent: es transcriu el que es parla (reconeixement de la parla), el text resultant es tradueix a l’idioma desitjat en format text i aquest text es torna a convertir al llenguatge oral. Gràcies a aquest procés, el sistema pot detectar les pauses, pot resoldre les difluències que es donen en la llengua parlada i és capaç de donar a la comunicació l’entonació i el sentit adequats.
Amb el nou sistema, el resultat de la cerca d’un vídeo o un àudio és un document, bé amb la veu traduïda i sintetitzada en l’idioma que es desitgi, bé subtitulat en un altre idioma. En cas que el document buscat tingui format text, el resultat podrà ser igualment un text i també un arxiu d’àudio en l’idioma de traducció escollit.
Aquesta aplicació és la primera que tradueix emissions de ràdio, televisió i text en totes les llengües de l’Estat espanyol, a més de l’anglès. “Pot traduir una emissió de televisió en basc al català en àudio i en text. A més, permet que la paraula de cerca es pugui introduir en qualsevol d’aquests idiomes i obtenir resultats per als mateixos idiomes”, explica Asunción Moreno, coordinadora de BUCEADOR.
El projecte, liderat per la UPC, es desenvolupa en el marc del Pla Nacional d’R+D+i amb la participació de les universitats del País Basc i de Vigo, i amb el suport de Barcelona Media. En l’equador de la recerca, que finalitzarà el 2012, ara s’està desenvolupant un prototipus que estarà llest al juliol.
L’objectiu final del projecte és millorar les tecnologies i sistemes de reconeixement automàtic de la parla, la traducció i la síntesi de veu. Tot i que l’aplicació està pensada per ser emprada a la indústria audiovisual, “el sistema pot convertir-se en un buscador que posi a l’abast de tothom imatges en moviment, fotografies i textos associats a una paraula i els pugui traduir a qualsevol idioma”, preveu Moreno.
La traducció, centre del sistema
El projecte BUCEADOR va un pas més enllà d’un projecte anterior, anomenat AVIVAVOZ, en el marc del qual la UPC va desenvolupar, amb les universitats del País Basc i de Vigo, un sistema de subtitulat automàtic d’arxius de vídeo per a les llengües gallega, catalana i castellana. Els sistemes de traducció emprats per la UPC són estadístics, ja que, com el traductor de Google o el N-II —traductor automàtic per a castellà, català i anglès desenvolupat pel Grup VEU de la UPC, són idonis per traduir la parla. Superen els sistemes basats en regles perquè són capaços de resoldre traduccions de paraules lligades, aprenen de les traduccions i se’ls pot entrenar per especialitzar-los en registres o àmbits específics. En traduccions que depenen del context, com és el cas de la paraula ‘porter’, aquests traductors són capaços de discernir si parlem del ‘porter’ de futbol o del ‘porter’ d’un edifici.
Les traduccions desenvolupades per la UPC segueixen el procés següent: es transcriu el que es parla (reconeixement de la parla), el text resultant es tradueix a l’idioma desitjat en format text i aquest text es torna a convertir al llenguatge oral. Gràcies a aquest procés, el sistema pot detectar les pauses, pot resoldre les difluències que es donen en la llengua parlada i és capaç de donar a la comunicació l’entonació i el sentit adequats.
Segueix-nos a Twitter
