1) Banco de voces GPL

VoxForge en un banco de voces que se está construyendo para que algunos programas puedan hacer el reconocimiento.

1.1) Grabación

En su página hay forma de grabar nuestras voces para construir el dichoso banco. Pero al intentar grabar la mía con Ubuntu Lucid tuve errores de permisos locales con Firefox y Java. Finalmente terminé actualizando java: http://gabenell.blogspot.com/2010/04/installing-sun-java-6-on-ubuntu-104.html

También tuve que desinstalar los siguientes plugins:

sudo apt-get remove icedtea-6-jre-cacao icedtea6-plugin-bin

Finalmente ver que este estuviera:

sudo apt-get install sun-java6-plugin

Lo más próximo a mi modelo de voz es aspañol Argentina, por lo que completé así:

Imágen de configuración de VoxForge

Parece ser que el proceso lleva un 60% de lo que se requeriría para el idioma español, por lo que sería bueno que tod@s hiciéramos nuestra contribución: http://www.voxforge.org/es/read

1.2) Descarga

Para descargarse el corpus o modelo en español, basta ir a una terminal, crear una carpeta y correr wget. Es decir

mkdir corpus-escd corpus-edwget -N -nd -c -e robots=off -A tgz,html -r -np  http://www.repository.voxforge1.org/downloads/es/Trunk/Audio/Main/8kHz_16bit/

2) Programa de reconocimiento (para Ubuntu Lucid)

(Este es todo un tema que iremos desarrollando.)

2.1 Simon

Se instala de manera sencilla en Ubuntu, pero lo que que necesita es un modelo de habla que consiste en dos partes:

  • un modelo de idioma
  • un modelo acústico

Esisten al momento de escribir estas líneas (fines de 2010) modelos de habla disponibles en inglés y alemnán pero no en español.

2.1.1 HTK

Instalación de HTK requerida por Simon: http://www.simon-listens.org/wiki/index.php/Installation#HTK_installation_2

En mi caso, lo descargué, lo despomprimí, y luego:

make clean ; ./configure --prefix=/usr/local ; make ; sudo make install

2.2 Sphinx

(en construcción)

sudo add-apt-repository ppa:swift-core/ppa ; sudo apt-get update

Modelo en español: http://ufpr.dl.sourceforge.net/project/cmusphinx/Acoustic%20and%20Language%20Models/Voxforge%20Spanish/voxforge-es-0.1.tar.gz

3) Enlaces interesantes

Ver video reconocimiento y Python: http://www.youtube.com/watch?v=3VA2Th121zQ

General: http://ubanov.wordpress.com/2008/11/28/reconocimiento-de-voz-en-castellano/

Programa1 Simon: http://sourceforge.net/projects/speech2text/

Programa2 Julius: http://julius.sourceforge.jp/en_index.php

Categorías: Tutorial

0 comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *