Premiada una investigación sobre reconocimiento de voz en móviles de alta gama
Fuente: Universidad de Granada
Investigadores del grupo de investigación SigMAT (Signal Processing, Multimedia Transmission and Speech/Audio Technologies) de la Universidad de Granada han sido recientemente premiados con el ‘Best Student Paper Award’ en el prestigioso congreso internacional ‘European Signal Processing Conference‘ (EUSIPCO’14, http://www.eusipco2014.org/awards/best-student-paper-awards/), celebrado en Lisboa. Este reconocimiento es otorgado al mejor artículo firmado por un estudiante de doctorado como primer autor.
El artículo premiado se titula Feature Enhancement for Robust Speech Recognition on Smartphones with Dual-Microphone y sus autores son Iván López Espejo (estudiante de doctorado de la UGR), Ángel M. Gómez García (profesor de la UGR), José A. González López (investigador de la Universidad de Sheffield, UK) y Antonio M. Peinado Herreros (catedrático de la Universidad de Granada y coordinador de SigMAT).
El artículo trata sobre cómo obtener un reconocimiento de voz de muy alta calidad en móviles de gama alta equipados con dos micrófonos. Cada vez son más los usuarios que usan los diversos servicios disponibles de reconocimiento automático de voz para interactuar con su smartphone y, en particular, para dictar mensajes cortos y WhatsApps sin tener que usar el pequeño teclado de pantalla.
Uno de los principales retos tecnológicos de estos servicios es el de conseguir dispositivos capaces de proporcionar una alta precisión de reconocimiento incluso cuando se hace uso de ellos en ambientes ruidosos (calle, estaciones de autobús, aeropuertos, restaurantes, etc). Muchos nuevos smartphones incorporan un micrófono dual (pareja de micrófonos sincronizados) para mejorar la calidad de la voz transmitida.
Dos micrófonos en lugar de uno
Los autores del artículo han sido los primeros en proponer soluciones técnicas para su aprovechamiento en los servicios de reconocimiento de voz, consiguiendo mejoras muy notables respecto a otras técnicas clásicas basadas en el uso de un sólo micrófono.
Los investigadores del grupo SigMAT (http://ceres.ugr.es/sigmat/) tienen una experiencia de más de 15 años en el campo del reconocimiento automático de voz para móviles, tema sobre el que han publicado numerosos artículos en prestigiosas revistas como los Transactions del IEEE y un libro específico para la editorial Wiley & Sons(http://eu.wiley.com/WileyCDA/WileyTitle/productCd-0470024003.html).
El grupo SigMAT de la UGR tiene también proyectos activos en otros temas relacionados con las tecnologías multimedia, como la mejora de la calidad de vídeo para TV en móviles o de la calidad de voz en telefonía IP, y el procesado de señal aplicado a la clasificación de proteínas o al uso de señales ultrasónicas para el testeo de materiales y para la monitorización del crecimiento de córneas artificiales.
Referencia bibliográfica:
Iván López-Espejo, Ángel M. Gómez, José A. González y Antonio M. Peinado: “Feature Enhancement for Robust Speech Recognition on Smartphones with Dual-Microphone”. Proc. EUSIPCO, Lisboa (Portugal), Septiembre 2014
Contacto:
Antonio M. Peinado
Coordinador del grupo de investigación SigMAT (Signal Processing, Multimedia Transmission and Speech/Audio Technologies)
Web: http://ceres.ugr.es/sigmat/
Dpto. de Teoría de la Señal, Telemática y Comunicaciones y CITIC-UGR
Tlfno: 958 240 031
Correo electrónico: amp@ugr.es
Últimas publicaciones
Un grupo de investigación de la Universidad de Cádiz ha empleado un sistema de extracción ‘verde’ para identificar la cantidad de este aminoácido esencial, necesario para producir proteínas, así como la hormona melatonina y el neurotransmisor serotonina en el organismo. Tras los ensayos, realizados con hongos comestibles del sur de Andalucía y el norte de Marruecos, los resultados evidencian su alta concentración en este tipo de alimentos y abre nuevas vías de estudio para determinar su potencial terapéutico.
Sigue leyendoUn equipo de investigación de la Universidad de Málaga ha evaluado a casi un centenar de estudiantes de entre 8 y 12 años para entender mejor los desafíos léxicos a los que se enfrentan aquellos con pérdida auditiva. Las expertas sugieren un enfoque basado en relaciones entre determinadas clases de palabras para mejorar su aprendizaje y que puedan estudiar en igualdad de condiciones que sus compañeros oyentes.
Nos encontramos a menos de un día del solsticio de diciembre, que tendrá lugar a las 10:20 de este sábado, hora española. Esta efeméride marca el comienzo de las estación astronómicas de invierno para el hemisferio norte. Dejamos atrás el otoño, con sus tonalidades amarillas, naranjas y marrones, y damos paso al color blanco de los copos de nieve, a las luces de colores, y a las flores de pascua. Son algunos de los protagonistas de estas fiestas, que también tienen su ciencia. Por ello os proponemos descubrir diferentes curiosidades científicas relacionadas con la Navidad. ¿Sabías que el espumillón comenzó a fabricarse de aluminio y plomo y con el paso del tiempo ha variado su composición para hacerse ahora de PVC? ¿Te has preguntado alguna vez por qué las típicas flores de esta época del año son esas y no otras? ¿ O cuánto consumen las luces led del árbol que adornas cada año?
Sigue leyendo