DUVI/ Un sistema que permite a busca e tradución de contidos audiovisuais en castelán, galego, vasco, catalán e inglés ou, o que é o mesmo, un método que permite que o usuario poida facer unha consulta mediante a súa voz e obter a información cun audio sintético no idioma desexado. Así é o primeiro sistema multilingüe de busca e tradución de contidos audiovisuais que se está a desenvolver no marco de BUCEADOR, un proxecto de investigación que se está a levar a cabo no marco do Plan Nacional de I+D coa participación das universidades Politécnica de Catalunya, País Vasco e Vigo.
O proxecto, liderado pola UPC e coordinado en Vigo polo profesor Eduardo Rodríguez Banga, permite traducir unha emisión de televisión dun idioma a outro en audio e en texto. “Trátase de que partindo dunha serie de contidos audiovisuais en calquera lingua do Estado ou mesmo en inglés, lle poidas facer preguntas a un sistema de recuperación da información relacionada cunha serie de palabras clave e el se encargue da busca”, subliña o profesor Rodríguez Banga, investigador doGrupo de Tecnoloxías Multimedia, equipo cunha longa traxectoria de investigación nas tecnoloxías da fala.
O primeiro prototipo, en verán
O primeiro prototipo estará listo este verán, se ben a finalización do proxecto non se prevé ata decembro 2012. O obxectivo final é seguir mellorando nas tecnoloxías e sistemas de recoñecemento automático da fala, a tradución e a síntese de voz, aspectos que dende Vigo destacan poden ter múltiples aplicacións prácticas. Desde a axuda de acceso a información a persoas discapacitadas, sobre todo, aquelas que teñen problemas visuais, ata servizos de domótica no fogar e “en xeral, calquera aplicación onde a comunicación vocal teña sentido, como é o caso do acceso a información por vía telefónica ou a maior parte dos sistemas de atención ao cliente”.
Aínda que a aplicación está pensada para ser empregada na industria audiovisual, o sistema nace tamén coma un buscador que pon ao alcance de calquera usuario imaxes en movemento, fotografías e textos asociados a unha palabra e pode traducilos a outro idioma. Ademais, a esta información podería accederse por texto, na lingua na que xa están os contidos, ou directamente por voz, é dicir, que un usuario realizaría unha pregunta falando, e o recoñecedor de voz recoñecería o texto correspondente a esa pregunta, o tradutor traduciría esa pregunta aos idiomas dispoñibles e o usuario recuperaría a información no seu propio idioma. “Si temos gravado un telexornal en galego e, por exemplo, un madrileño quere recuperar algún contido poderá facelo no seu propio idioma, é dicir, en castelán”, explica Rodríguez Banga.