•Notícia
En el marco del proyecto europeo EUNISON, financiado por la Unión Europea
El CIMNE y La Salle R&D participan en la creación del primer simulador de voz real
El proyecto tiene como objetivo crear un simulador para ‘visualizar ' la voz, que tendrá aplicaciones innovadoras en los campos de la síntesis del habla, la medicina, la logopedia, la biomecánica, la robótica e, incluso, el establecimiento de nuevas formas de expresión cultural.
26/05/2014
El Centro Internacional de Métodos Numéricos en Ingeniería (CIMNE), centro consorciado por la Universitat Politècnica de Catalunya · BarcelonaTech (UPC) y la Generalitat de Catalunya, y el grupo de investigación en Tecnologías Media (GTM) de La Salle R&D participan en el proyecto europeo Extensive UNIfied-domain SimulatiON of the human Voice (EUNISON), financiado por la Unión Europea, y que se centra en simular por primera vez de forma unificada todo el órgano de generación de voz, recurriendo a la supercomputación y estudios experimentales. EUNISON permitirá ‘visualizar’ la voz y tendrá aplicaciones en campos tan diversos como la síntesis del habla, la medicina, la logopedia, la biomecánica, la robótica o, incluso, en el establecimiento de nuevas formas de expresión cultural, entre otros ámbitos.
El habla nos diferencia de los otros mamíferos y constituye el mecanismo básico que tenemos para comunicarnos con otros individuos de nuestra especie, es nuestra principal conexión con el mundo y tiene una función fundamental en la sociedad moderna.
Sin embargo, los procesos físicos involucrados en la producción de voz humana son de una gran complejidad. Ahora, aplicando tecnología de supercomputación y basándose en numerosos estudios experimentales, los investigadores del proyecto tratan de simular de forma unificada el órgano de generación de la voz: desde la activación neuromuscular básica hasta las ondas acústicas emitidas por los labios cuando se pronuncia, por ejemplo, una sílaba.
Para los médicos, que necesitan conocer cómo se originan los problemas con la voz y cómo deben ser diagnosticados y tratados, una visualización precisa y dinámica de la biomecánica los conduciría a un progreso significativo. Por otra parte, las simulaciones animadas de lo que realmente sucede en el interior del cuerpo humano durante el habla y el canto serían de gran ayuda para los estudiantes de idiomas y de artes vocales, por lo que se hace necesaria una simulación detallada de la voz humana, tanto para la ciencia como para numerosas y diversas aplicaciones.
Los principios de la física clásica son la base para lograr una simulación computacional de la producción de la voz humana. La mayoría de las estrategias de modelado actuales buscan, principalmente, generar sólo la señal acústica de la voz y adoptar numerosas aproximaciones y simplificaciones para lograr este objetivo. Por ejemplo, las síntesis de voz que se comercializan no se basan en los principios físicos, sino que recurren a elaborar concatenaciones de segmentos de audio previamente grabados. EUNISON trata de simular de forma más directa la física por la que el cuerpo produce la señal de voz.
En este sentido, la aportación del equipo del CIMNE en este proyecto, encabezada por el profesor Ramón Codina, se centra concretamente en la simulación numérica, mediante grandes supercomputadores, del flujo de aire que resulta en la generación de sonido y de la voz en el interior del cuerpo humano, concretamente en el tracto bucal.
El proyecto, que arrancó en marzo de 2013, obtendrá resultados dentro de un año, aproximadamente, y permitirá ‘visualizar’ la voz, así como dar pistas para saber cómo funciona y la forma en que ésta falla. A largo plazo, se prevé un modelo computacional detallado de la voz humana que pueda ser controlado con las señales de entrada a diferentes niveles de representación: topológico, neuro-motórico o fonético. Como motor de simulación, tendrá aplicaciones en campos tan diversos como la medicina, la otorrinolaringología, la logopedia, la síntesis del habla, la comunicación hombre-máquina, la robótica, la biomecánica, así como la influencia en el establecimiento de nuevas formas de expresión cultural.
El método de esta investigación es conseguir un dominio computacional unificado, en el que la dinámica de sólidos, fluidos/gases y las ondas acústicas se moldean simultáneamente, se trata de un potencial gran avance. El reto computacional central es extender la metodología actual de manera que pueda hacer frente a la mecánica de sólidos, colisiones elásticas, interacciones de estructuras fluidas, la aerodinámica y la acústica al mismo tiempo.
El desafío logístico es combinar el conocimiento de diversos campos, con el fin de formular y simular el conjunto detallado de las estructuras y las señales de control que el modelo requiere para que se comporten de forma realista. El desafío experimental es realizar experimentos de laboratorio con réplicas físicas para ir refinando continuamente la comprensión de la física de los procesos de fonación y articulatorios, mientras se confrontan y validan las simulaciones numéricas.
EUNISON, financiado en el marco del proyecto Future Emerging Technologies (FET)-OPEN de la Unión Europea, está liderado por el Royal Institute of Technology (KTH) de Estocolmo y, además de la UPC, también cuenta con la participación de La Salle Campus Barcelona-URL, la Friedrich Alexander Universität Erlangen Nürnberg (FAU) de Nuremberg y el Centre National de la Recherche Scientifique (CNRS) de Grenoble.
El habla nos diferencia de los otros mamíferos y constituye el mecanismo básico que tenemos para comunicarnos con otros individuos de nuestra especie, es nuestra principal conexión con el mundo y tiene una función fundamental en la sociedad moderna.
Sin embargo, los procesos físicos involucrados en la producción de voz humana son de una gran complejidad. Ahora, aplicando tecnología de supercomputación y basándose en numerosos estudios experimentales, los investigadores del proyecto tratan de simular de forma unificada el órgano de generación de la voz: desde la activación neuromuscular básica hasta las ondas acústicas emitidas por los labios cuando se pronuncia, por ejemplo, una sílaba.
Para los médicos, que necesitan conocer cómo se originan los problemas con la voz y cómo deben ser diagnosticados y tratados, una visualización precisa y dinámica de la biomecánica los conduciría a un progreso significativo. Por otra parte, las simulaciones animadas de lo que realmente sucede en el interior del cuerpo humano durante el habla y el canto serían de gran ayuda para los estudiantes de idiomas y de artes vocales, por lo que se hace necesaria una simulación detallada de la voz humana, tanto para la ciencia como para numerosas y diversas aplicaciones.
Los secretos de la voz
Tras décadas de investigación, los expertos del habla todavía están buscando cómo hacer que las voces artificiales, como las que facilitan la relación persona-máquina, suenen de la manera más natural posible.Los principios de la física clásica son la base para lograr una simulación computacional de la producción de la voz humana. La mayoría de las estrategias de modelado actuales buscan, principalmente, generar sólo la señal acústica de la voz y adoptar numerosas aproximaciones y simplificaciones para lograr este objetivo. Por ejemplo, las síntesis de voz que se comercializan no se basan en los principios físicos, sino que recurren a elaborar concatenaciones de segmentos de audio previamente grabados. EUNISON trata de simular de forma más directa la física por la que el cuerpo produce la señal de voz.
En este sentido, la aportación del equipo del CIMNE en este proyecto, encabezada por el profesor Ramón Codina, se centra concretamente en la simulación numérica, mediante grandes supercomputadores, del flujo de aire que resulta en la generación de sonido y de la voz en el interior del cuerpo humano, concretamente en el tracto bucal.
El proyecto, que arrancó en marzo de 2013, obtendrá resultados dentro de un año, aproximadamente, y permitirá ‘visualizar’ la voz, así como dar pistas para saber cómo funciona y la forma en que ésta falla. A largo plazo, se prevé un modelo computacional detallado de la voz humana que pueda ser controlado con las señales de entrada a diferentes niveles de representación: topológico, neuro-motórico o fonético. Como motor de simulación, tendrá aplicaciones en campos tan diversos como la medicina, la otorrinolaringología, la logopedia, la síntesis del habla, la comunicación hombre-máquina, la robótica, la biomecánica, así como la influencia en el establecimiento de nuevas formas de expresión cultural.
El método de esta investigación es conseguir un dominio computacional unificado, en el que la dinámica de sólidos, fluidos/gases y las ondas acústicas se moldean simultáneamente, se trata de un potencial gran avance. El reto computacional central es extender la metodología actual de manera que pueda hacer frente a la mecánica de sólidos, colisiones elásticas, interacciones de estructuras fluidas, la aerodinámica y la acústica al mismo tiempo.
El desafío logístico es combinar el conocimiento de diversos campos, con el fin de formular y simular el conjunto detallado de las estructuras y las señales de control que el modelo requiere para que se comporten de forma realista. El desafío experimental es realizar experimentos de laboratorio con réplicas físicas para ir refinando continuamente la comprensión de la física de los procesos de fonación y articulatorios, mientras se confrontan y validan las simulaciones numéricas.
EUNISON, financiado en el marco del proyecto Future Emerging Technologies (FET)-OPEN de la Unión Europea, está liderado por el Royal Institute of Technology (KTH) de Estocolmo y, además de la UPC, también cuenta con la participación de La Salle Campus Barcelona-URL, la Friedrich Alexander Universität Erlangen Nürnberg (FAU) de Nuremberg y el Centre National de la Recherche Scientifique (CNRS) de Grenoble.
Segueix-nos a Twitter