Reconocimiento automático del habla

RESUMEN

Para construir un sistema de reconocimiento de habla, es necesario tener aptitudes en muchas disciplinas además del desarrollo de software. Actualmente existen varios enfoques, normalmente las empresas mas grandes cómo Google o Apple aplican Redes Neuronales. Cómo nos gusta el sonido, durante éste mes estuvimos experimentando un enfoque mas ligero que se aplica en dominios mas acotados. Consiste en la extracción de características y análisis DTW. Subimos a Github un repositorio con el trabajo realizado, el sistema extrae 12 coeficientes MFCC por defecto para el ancho de banda y se utilizan algoritmos K-NN para comparar el dataset.

Puedes descargar el proyecto en el siguiente enlace: https://github.com/nahuelproietto/SpeechProcessingSwift

ADBANDNovember 29, 2013speech recognition, software, open source