Mejoran los programas de reconocimiento de voz

Por

julio 27, 2006

Por fin, la tecnología de reconocimiento de voz está encontrando la manera de hacerse escuchar.

Durante años, este tipo de software ha estado dominado por los programas de dictado y las aplicaciones para call centers, que permiten reservar vuelos sin hablar con un operador. Sin embargo, estos programas con frecuencia frustraban a los usuarios tanto como los ayudaban. «La primera generación de tecnología de reconocimiento de voz hacía que uno quisiera pegarse un tiro», dice Patrick Knorr, gerente general de Sunflower Broadband, un operador de cable de Kansas.

Ahora, las mejoras en la tecnología han cambiado el escenario. Al funcionar con mejor software, computación remota y nuevos principios de diseño, el reconocimiento de voz está mejorando rápidamente en algunos aparatos como los celulares. Y se está extendiendo hacia un amplio abanico de otros artículos, como controles remotos para televisores y reproductores de música para automóviles.

«La tecnología ha progresado tanto que la gente puede realmente sentirlo», dice Susan Shapiro, una gerente de marketing que ha pasado la última década probando software y aparatos de reconocimiento de voz para su uso personal. «Ha habido un drástico aumento en la viabilidad y la calidad. La tecnología de reconocimiento de voz ha madurado».

Los analistas no desglosan el tamaño del mercado para estos nuevos programas. Pero el mercado general para la tecnología de reconocimiento de voz está creciendo y estos nuevos productos y servicios se beneficiarán del aumento del interés.

En parte, estas nuevas aplicaciones tienen éxito al limitar lo que intentan lograr. En vez de intentar comprender todo lo que dice la persona que habla, los nuevos productos están diseñados para reconocer sólo una cantidad escogida de nombres o frases. Esto significa que los aparatos no tienen que escoger entre posibilidades infinitas para calcular cuál es el comando del usuario, lo cual a su vez produce más confiabilidad y un desempeño mucho más rápido.

Por ejemplo, está el dispositivo de comunicaciones de Vocera Communications, un aparato portátil que permite a los usuarios hablar entre ellos mediante una red Wi-Fi. El aparato está diseñado para descifrar sólo unos 50 comandos de voz, como «Llamar» o «Encontrar» a otro usuario, y sólo unos 10 se usan habitualmente, dice Brent Lang, subdirector de marketing de Vocera.

Muchos productos nuevos de reconocimiento de voz también eliminan uno de los principales inconvenientes de los primeros programas: el «entrenamiento». En el pasado, los usuarios tenían que hablar durante mucho tiempo al aparato para que éste reconociera las peculiaridades de sus patrones de habla. Ahora muchos programas funcionan sin necesidad de entrenamiento.

Las nuevas tecnologías de reconocimiento de voz ayudan a una serie de nuevos servicios. Por ejemplo, Electronic Learning Products Inc. vende desde el año pasado un software que enseña a cantar. El software de reconocimiento de tono identifica qué notas está cantando una persona y provee retroalimentación visual en la pantalla: una línea del pentagrama indica qué notas se están cantando, junto a las notas originales de la canción.

Fuente: The Wall Street Journal, Jeanette Borzo

Mejoran los programas de reconocimiento de voz

Acervo de noticias sobre Inteligencia Artificial

El Pentágono adopta IA para maniobras militares

Google estrena ‘modo con IA’ en su buscador

Premian a investigadores visionarios en IA

China celebra avance de DeepSeek

Liz Wright, primera persona clonada con IA para publicidad

Lo más popular en MC

Liz Wright, primera persona clonada con IA para publicidad

Albania cerrará TikTok por un año para proteger a niños

EU detiene operaciones cibernéticas ofensivas contra Rusia

Xiaomi potencia la inteligencia conectada con la Serie Xiaomi 15

El Pentágono adopta IA para maniobras militares