Mozilla se aproxima al habla humana con su herramienta de reconocimiento de voz
La compañía ha lanzado un software con un código abierto que permite a los desarrolladores acceder gratuitamente al proyecto, el cual está formado por voces de 20.000 personas de todo el mundo.
Mozilla alza la voz. La empresa estadounidense ha lanzado una herramienta de reconocimiento de voz “próxima al rendimiento de un humano”, de acuerdo con la compañía. El software, llamado DeepSpeech, cuenta con un código abierto que permite a los desarrolladores acceder de forma gratuita al proyecto.
Sean White, director ejecutivo de Mozilla, ha explicado que desde la empresa creen que “la tecnología debe ser abierta y accesible para todos, y eso incluye la voz”. La compañía lanzó este miércoles un primer conjunto de grabaciones diseñado para que cualquier persona pruebe algoritmos de aprendizaje automático.
El conjunto de datos que la empresa ha puesto a disposición de los desarrolladores incluye 400.000 muestras de voz descargables, un paquete de audio en el que 20.000 personas de todo el mundo han contribuido en su composición tras una convocatoria realizada por Mozilla.
La empresa confía en que este proyecto ayude a los futuros sistemas de voz a comprender con fluidez una amplia variedad de acentos y tipos de habla. DeepSpeech cuenta con una tasa de error por palabra de aproximadamente un 6,5%, una cifra positiva respecto al 10% establecido por la compañía.