miércoles, 19 de octubre de 2011

Reconocimiento de voz en Linux + (video tutorial)

Últimamente el tema del reconocimiento de voz está muy de moda: el lanzamiento del iPhone 4S y de iOS 5 ha destacado por la inclusión de Siri, el asistente disponible en inglés que permite dar órdenes de voz y tener casi casi una “conversación inteligente” con estos smartphones.

Lo cierto es que las tecnologías de reconocimiento de voz llevan ya mucho tiempo con nosotros, pero su uso ha estado limitado por la precisión de dichos desarrollos software, que a menudo no era la deseada. La cosa ha mejorado en los últimos tiempos, pero parecía que los programas de reconocimiento de voz solo servían para dictar largos textos de cuando en cuando.
Siri ha demostrado que la aplicación de dichos sistemas puede ser muy útil, y como ya sabéis Google había hecho ya algo muy similar con las Búsquedas por voz y las Acciones de Voz de Android que también permiten ofrecer funciones similares, pero… ¿qué pasa con Linux?
Pues en nuestro sistema operativo preferido tenemos al menos dos alternativas destacadas, que pasamos a describir.

Simon

Es un sistema de reconocimiento de voz que puede utilizarse para controlar la interfaz de usuario y que funciona especialmente bien con KDE, ya que ha sido escrito en C++ usando Qt y KDE para la interfaz de usuario, lo que garantiza su integración con KDE 4. No obstante, es posible usar Simon con otros entornos de escritorio y gestores de ventanas.
El programa está desarrollado originalmente en Alemania, y de hecho en su página oficial la página de inicio se muestra en alemán, y hay traducciones al inglés e incluso al español, aunque esta última es bastante mala.
Por el momento los idiomas soportados son el alemán y el inglés, así que aunque el español podría estar soportado en el motor de reconocimiento que usa Simon, y que se llama Julius, pero parece que se necesita un diccionario que por lo visto también tiene que tener transcripciones fonéticas para que trabaje con Simon.
VoxForge es precisamente el principal recurso de transcripciones de voz que se pueden usar en motores de reconocimiento de voz, pero por el momento no existe un modelo acústico completo, que de hecho podéis ayudar a construir con vuestras propias voces en la página oficial de VoxForge, como explican aquí. Atención no obstante a esta descarga que hemos visto a través del motor Sphinx, que parece ser un paquete con el modelo acústico en español, que puede serviros de ayuda.
video

No hay comentarios:

Publicar un comentario

Comenta tu opinión vale mucho.