1) Banco de voces GPL
VoxForge en un banco de voces que se está construyendo para que algunos programas puedan hacer el reconocimiento.
1.1) Grabación
En su página hay forma de grabar nuestras voces para construir el dichoso banco. Pero al intentar grabar la mía con Ubuntu Lucid tuve errores de permisos locales con Firefox y Java. Finalmente terminé actualizando java: http://gabenell.blogspot.com/2010/04/installing-sun-java-6-on-ubuntu-104.html
También tuve que desinstalar los siguientes plugins:
sudo apt-get remove icedtea-6-jre-cacao icedtea6-plugin-bin
Finalmente ver que este estuviera:
sudo apt-get install sun-java6-plugin
Lo más próximo a mi modelo de voz es aspañol Argentina, por lo que completé así:
Parece ser que el proceso lleva un 60% de lo que se requeriría para el idioma español, por lo que sería bueno que tod@s hiciéramos nuestra contribución: http://www.voxforge.org/es/read
1.2) Descarga
Para descargarse el corpus o modelo en español, basta ir a una terminal, crear una carpeta y correr wget. Es decir
mkdir corpus-escd corpus-edwget -N -nd -c -e robots=off -A tgz,html -r -np http://www.repository.voxforge1.org/downloads/es/Trunk/Audio/Main/8kHz_16bit/
2) Programa de reconocimiento (para Ubuntu Lucid)
(Este es todo un tema que iremos desarrollando.)
2.1 Simon
Se instala de manera sencilla en Ubuntu, pero lo que que necesita es un modelo de habla que consiste en dos partes:
- un modelo de idioma
- un modelo acústico
Esisten al momento de escribir estas líneas (fines de 2010) modelos de habla disponibles en inglés y alemnán pero no en español.
2.1.1 HTK
Instalación de HTK requerida por Simon: http://www.simon-listens.org/wiki/index.php/Installation#HTK_installation_2
En mi caso, lo descargué, lo despomprimí, y luego:
make clean ; ./configure --prefix=/usr/local ; make ; sudo make install
2.2 Sphinx
(en construcción)
sudo add-apt-repository ppa:swift-core/ppa ; sudo apt-get update
Modelo en español: http://ufpr.dl.sourceforge.net/project/cmusphinx/Acoustic%20and%20Language%20Models/Voxforge%20Spanish/voxforge-es-0.1.tar.gz
3) Enlaces interesantes
Ver video reconocimiento y Python: http://www.youtube.com/watch?v=3VA2Th121zQ
General: http://ubanov.wordpress.com/2008/11/28/reconocimiento-de-voz-en-castellano/
Programa1 Simon: http://sourceforge.net/projects/speech2text/
Programa2 Julius: http://julius.sourceforge.jp/en_index.php