Por fin, la tecnología de reconocimiento de voz está encontrando la manera de hacerse escuchar.
Durante años, este tipo de software ha estado dominado por los programas de dictado y las aplicaciones para call centers, que permiten reservar vuelos sin hablar con un operador. Sin embargo, estos programas con frecuencia frustraban a los usuarios tanto como los ayudaban. «La primera generación de tecnología de reconocimiento de voz hacía que uno quisiera pegarse un tiro», dice Patrick Knorr, gerente general de Sunflower Broadband, un operador de cable de Kansas.
Ahora, las mejoras en la tecnología han cambiado el escenario. Al funcionar con mejor software, computación remota y nuevos principios de diseño, el reconocimiento de voz está mejorando rápidamente en algunos aparatos como los celulares. Y se está extendiendo hacia un amplio abanico de otros artículos, como controles remotos para televisores y reproductores de música para automóviles.
«La tecnología ha progresado tanto que la gente puede realmente sentirlo», dice Susan Shapiro, una gerente de marketing que ha pasado la última década probando software y aparatos de reconocimiento de voz para su uso personal. «Ha habido un drástico aumento en la viabilidad y la calidad. La tecnología de reconocimiento de voz ha madurado».
Los analistas no desglosan el tamaño del mercado para estos nuevos programas. Pero el mercado general para la tecnología de reconocimiento de voz está creciendo y estos nuevos productos y servicios se beneficiarán del aumento del interés.
En parte, estas nuevas aplicaciones tienen éxito al limitar lo que intentan lograr. En vez de intentar comprender todo lo que dice la persona que habla, los nuevos productos están diseñados para reconocer sólo una cantidad escogida de nombres o frases. Esto significa que los aparatos no tienen que escoger entre posibilidades infinitas para calcular cuál es el comando del usuario, lo cual a su vez produce más confiabilidad y un desempeño mucho más rápido.
Por ejemplo, está el dispositivo de comunicaciones de Vocera Communications, un aparato portátil que permite a los usuarios hablar entre ellos mediante una red Wi-Fi. El aparato está diseñado para descifrar sólo unos 50 comandos de voz, como «Llamar» o «Encontrar» a otro usuario, y sólo unos 10 se usan habitualmente, dice Brent Lang, subdirector de marketing de Vocera.
Muchos productos nuevos de reconocimiento de voz también eliminan uno de los principales inconvenientes de los primeros programas: el «entrenamiento». En el pasado, los usuarios tenían que hablar durante mucho tiempo al aparato para que éste reconociera las peculiaridades de sus patrones de habla. Ahora muchos programas funcionan sin necesidad de entrenamiento.
Las nuevas tecnologías de reconocimiento de voz ayudan a una serie de nuevos servicios. Por ejemplo, Electronic Learning Products Inc. vende desde el año pasado un software que enseña a cantar. El software de reconocimiento de tono identifica qué notas está cantando una persona y provee retroalimentación visual en la pantalla: una línea del pentagrama indica qué notas se están cantando, junto a las notas originales de la canción.
Fuente: The Wall Street Journal, Jeanette Borzo