Diseñan un sistema que permite dirigir un robot con la voz

Fuente: Carolina Moya / Fundación Descubre

30 de marzo de 2015

El investigador de la Universidad de Málaga Alberto Poncela, responsable del proyecto

Investigadores del grupo ISIS de la Universidad de Málaga han diseñado un sistema para controlar de forma remota un robot con la voz. El método logra una alta tasa de reconocimiento de palabras y el control de la plataforma robótica en tareas de navegación, ventajas que abren la puerta a su futura aplicación a otros dispositivos, como sillas de ruedas, en entornos de asistencia a personas.

Según reconocen los expertos, en la actualidad existen diversos sistemas de reconocimiento de voz para el control robótico. Sin embargo, el suyo muestra diferencias en dos aspectos: el idioma, ya que es de los pocos para hispanohablantes y la tasa de éxito en el reconocimiento.

Los expertos han desarrollado su modelo acústico en el sistema operativo Linux, ya que la arquitectura para controlar el robot trabaja con varios procesos simultáneos. Asimismo, en lo referente al idioma, han utilizado un software denominado Julius/Julian, un sistema de reconocimiento de voz de código abierto. “Actualmente solo hay modelos acústicos para japonés e inglés. Al no existir modelo acústico específico para español, el desarrollo de este elemento ha supuesto la parte central de nuestro trabajo”, reconoce a la Fundación Descubre el investigador de la Universidad de Málaga Alberto Poncela, responsable del proyecto.

Otra ventaja son los resultados que obtiene ese modelo acústico en las pruebas a las que se somete. “Conseguimos una tasa de reconocimiento de palabras cercana al 99% y una tasa de reconocimiento de comandos, es decir, de órdenes, del 95% o superior. A esto se suma que el robot consigue ir al sitio que se le envía bajo el control de la voz de un usuario no experto”, subraya Poncela.

Los investigadores apuntan que estos resultados del estudio titulado ‘Command-based voice teleoperation of a mobile robot via a human/robot interface’ y publicado en la revista Robotica, abren la puerta a la posibilidad de adaptar el sistema a otras plataformas robóticas, como sillas de ruedas, lo que supondría su aplicación en entornos asistenciales.

Construyendo el modelo

El investigador de la Universidad de Málaga Alberto Poncela, responsable del proyecto

¿Cómo reconoce el robot una orden emitida por una persona? Para ello se requieren varios elementos. Por un lado, el léxico, el conjunto de palabras que el sistema puede reconocer. A este se sumaría la gramática, las reglas y las restricciones de ese vocabulario. “Además hay que construir un modelo acústico, es decir, la representación estadística de los sonidos que forman cada una de las palabras habladas usadas en la gramática. El modelo acústico se obtiene tras una fase de entrenamiento. Nosotros hemos considerado 802 palabras, agrupadas en 72 frases”, precisa otra de las investigadoras participantes en el estudio Leticia Gallardo Estrella.

El sistema tiene que ser entrenado para cada usuario, ya que las características de la voz de cada persona son distintas, con lo que hay que afinar hasta hacerlo preciso y personalizado. “Para ello, se graban las frases de entrenamiento con un micrófono y se parametrizan con unos coeficientes numéricos con las características propias de la voz. A partir de estos coeficientes se construye el modelo acústico”, detalla la investigadora.

A continuación, el vocabulario, la gramática y el modelo acústico se introducen en el motor de voz, que tiene como salida la frase reconocida. “Definimos un juego de comandos técnicos de movimiento cortos, por ejemplo –parar-, y otros largos -girar 20 grados- que se emiten de forma remota con un micrófono, se reconoce el comando y, mediante wifi, la orden llega al robot, que tiene un punto de acceso”, especifica.

Pruebas de reconocimiento y navegación

Los investigadores han acometido dos tipos de pruebas para testear el sistema. Las primeras, para comprobar si el sistema reconoce la voz y las órdenes emitidas. Un comando sólo es correcto si se reconocen todas las palabras. Por ejemplo, la acción “girar” va asociada a un valor numérico (20) y una unidad (grados) en la frase “girar 20 grados”.

El sistema tiene en cuenta todas esas variables y consigue, en palabras de los investigadores, buenos resultados. “Alcanzamos una tasa de reconocimiento de palabras cercana al 99% y una tasa de reconocimiento de comandos del 95% o superior”, incide Alberto Poncela.

El segundo tipo de pruebas guardan relación con la navegación. Para ello, simularon entornos complejos para que un robot modelo Pioneer P2AT los recorriera y llegara a un punto. Un usuario no experto en robótica emitió las órdenes con un micrófono. “El resultado fue que esta persona hizo llegar el robot a su destino”, subraya.

Este trabajo se enmarca en el proyecto ‘Sistema Inteligente de Asistencia Domiciliaria’ SIAD destinado a crear una arquitectura genérica capaz de adaptarse por sí misma a distintos tipos de usuarios mediante aprendizaje y financiado por la Consejería de Economía, Innovación, Ciencia y Empleo de la Junta de Andalucía.

Referencia:

Alberto Poncela, Leticia Gallardo-Estrella. ‘Command-based voice teleoperation of a mobile robot via a human-robot interface’. Robotica, 33 (1), pp. 1-18, 2015.

Imágenes:

El investigador de la Universidad de Málaga Alberto Poncela, responsable del proyecto

https://www.flickr.com/photos/fundaciondescubre/16974751511/

https://www.flickr.com/photos/fundaciondescubre/16768294897/

Más información:

FUNDACIÓN DESCUBRE

Departamento de Comunicación

Teléfono: 954232349. Extensión 140

e-mail: comunicacion@fundaciondescubre.es

Últimas publicaciones

#CienciaDirecta

Ciencia Ciudadana, Ciencias del Mar

Un sistema basado en ciencia ciudadana relaciona las condiciones del mar en primavera con la llegada de medusas en verano

Huelva | 15 de agosto de 2025

Investigadores de la Universidad de Huelva han utilizado miles de observaciones ciudadanas para cruzarlas con variables ambientales como la salinidad, la productividad del agua o la dirección de las corrientes. El análisis permitió generar mapas de probabilidad de presencia y detectar patrones que podrían ser útiles para desarrollar sistemas de alerta temprana en la costa andaluza.

Sigue leyendo

Andalucía observa la desintegración de la cuarta etapa del cohete chino Jielong-3

Andalucía | 11 de agosto de 2025

La noche del 10 de agosto, numerosas personas fueron testigos de la desintegración de la cuarta etapa del cohete Jielong-3 que lanzó al espacio China el pasado 8 de agosto. Esta bola de fuego artificial fue registrada por los detectores que el Proyecto SMART opera en los observatorios de Calar Alto (Almería), La Hita (Toledo), Sierra Nevada (Granada), Otura (Granada), Huelva y Sevilla.

Sigue leyendo

#CienciaDirecta

Ingeniería Química

Aplican nanotubos para conseguir antibióticos más resistentes y eficaces

Huelva, Sevilla | 10 de agosto de 2025

Un equipo de investigación de la Universidad de Huelva ha ampliado la acción de dos medicamentos mediante su administración en nanotubos de carbono. Con esta estrategia probada en laboratorio consiguen que actúen de manera más precisa en el foco de infección y que su efecto dure más tiempo.

Sigue leyendo

#CienciaDirecta

Tu fuente de noticias sobre ciencia andaluza

Más información Suscríbete

¿ERES CIENTÍFICO/A Y QUIERES DIFUNDIR TUS RESULTADOS? CONTÁCTANOS

¿QUIERES CONTACTAR CON UN CIENTÍFICO/A? CONSULTA LA GUÍA EXPERTA

Política de cookies

Este sitio web utiliza cookies para mejorar su experiencia mientras navega por el sitio web. De estas, las cookies que se clasifican como necesarias se almacenan en su navegador, ya que son esenciales para el funcionamiento de las funcionalidades básicas del sitio web. También utilizamos cookies de terceros que nos ayudan a analizar y comprender cómo utiliza este sitio web. Estas cookies se almacenarán en su navegador solo con su consentimiento. También tiene la opción de optar por no recibir estas cookies. Pero la exclusión voluntaria de algunas de estas cookies puede afectar su experiencia de navegación.

Necesarias

Siempre activado

Las cookies necesarias son absolutamente esenciales para que el sitio web funcione correctamente. Esta categoría solo incluye cookies que garantizan funcionalidades básicas y características de seguridad del sitio web. Estas cookies no almacenan ninguna información personal.

Cookie	Duración	Descripción
CONSENT	16 años 7 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies.
cookielawinfo-checkbox-advertisement	1 año	La cookie se establece mediante el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies en la categoría "Publicidad".
cookielawinfo-checkbox-analytics	1 año	Estas cookies están configuradas por el complemento de WordPress de consentimiento de cookies de GDPR. La cookie se utiliza para recordar el consentimiento del usuario para las cookies en la categoría "Análisis".
cookielawinfo-checkbox-necessary	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
cookielawinfo-checkbox-performance	1 año	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Rendimiento".
JCS_INENREF	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
JCS_INENTIM	1 hora	La cookie es parte de las medidas de seguridad del sitio web y se utiliza con fines antispam.
PHPSESSID	sessión	Esta cookie es nativa de las aplicaciones PHP. La cookie se utiliza para almacenar e identificar la identificación de sesión única de un usuario con el fin de administrar la sesión del usuario en el sitio web. La cookie es una cookie de sesión y se elimina cuando se cierran todas las ventanas del navegador.

Rendimiento

Las cookies de rendimiento se utilizan para comprender y analizar los índices de rendimiento clave del sitio web, lo que ayuda a brindar una mejor experiencia de usuario a los visitantes.

Cookie	Duración	Descripción
_gat	1 minuto	Google Universal Analytics instala estas cookies para acelerar la tasa de solicitud y limitar la recopilación de datos en sitios de alto tráfico.
YSC	sessión	Estas cookies son establecidas por Youtube y se utilizan para rastrear las vistas de videos incrustados.

Analítica

Las cookies analíticas se utilizan para comprender cómo los visitantes interactúan con el sitio web. Estas cookies ayudan a proporcionar información sobre métricas, el número de visitantes, la tasa de rebote, la fuente de tráfico, etc.

Cookie	Duración	Descripción
_ga	2 años	Esta cookie es instalada por Google Analytics. La cookie se utiliza para calcular los datos de visitantes, sesiones y campañas y realizar un seguimiento del uso del sitio para el informe de análisis del sitio. Las cookies almacenan información de forma anónima y asignan un número generado aleatoriamente para identificar visitantes únicos.
_gid	1 día	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan un sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio web. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas visitadas de forma anónima.

Las cookies publicitarias se utilizan para proporcionar a los visitantes anuncios y campañas de marketing relevantes. Estas cookies rastrean a los visitantes en los sitios web y recopilan información para proporcionar anuncios personalizados.

Cookie	Duración	Descripción
IDE	1 año 24 días	Utilizado por Google DoubleClick y almacena información sobre cómo el usuario utiliza el sitio web y cualquier otro anuncio antes de visitar el sitio web. Se utiliza para presentar a los usuarios anuncios que son relevantes para ellos de acuerdo con el perfil del usuario.
ms-uid	1 año	Estas cookies tienen una finalidad publicitaria. Contienen un valor único generado aleatoriamente que permite a la Plataforma distinguir navegadores y dispositivos. Esta información se utiliza para medir el rendimiento de los anuncios y proporcionar recomendaciones de productos basadas en datos.
NID	6 meses	Esta cookie se utiliza para crear un perfil en función del interés del usuario y mostrar anuncios personalizados a los usuarios.
test_cookie	15 minutos	Esta cookie la establece doubleclick.net. El propósito de la cookie es determinar si el navegador del usuario admite cookies.
VISITOR_INFO1_LIVE	5 meses 27 días	Youtube establece esta cookie. Se utiliza para rastrear la información de los videos de YouTube incrustados en un sitio web.