Inicio Articulos. Tecnología de reconocimiento voz: mucho más de lo que parece

Tecnología de reconocimiento voz: mucho más de lo que parece

Revista Mundo-Contact

     

 

Ya se encuentran en etapa de desarrollo e implantación sistemas automatizados de diálogo para las organizaciones más visionarias. Estos sistemas pueden entender instrucciones enunciadas utilizando lenguaje natural y/o la palabra escrita electrónica. Considerando los beneficios y la creciente impaciencia e insatisfacción del público con los esquemas "tradicionales" del call center, la adopción de esta nueva tecnología resulta incomprensiblemente lenta.

Los representantes de servicio humanos deberán ir ascendiendo en la cadena de valor, aplicando su intelecto en donde el intelecto humano más se necesita, y disponiendo de agentes automatizados para encargarse de las nimiedades. De cualquier manera se requiere que haya un agente humano a la mano para los procesos más complicados o inusuales, como por ejemplo resolución de conflictos, atención de quejas y manejo de excepciones.

 
  Tecnología de reconocimiento voz: mucho más de lo que parece

Dr Iain McKay*
Andrew Ferguson*

Hace mucho, mucho tiempo (hablando desde el punto de vista de la tecnología) los escritores y cineastas de ciencia ficción solían decir que los seres humanos podrían algún día hablar con sus máquinas, y que aquellos futuristas dispositivos (que, curiosamente, siempre hablaban con acento norteamericano) responderían con su peculiar y monótono estilo y reaccionarían a instrucciones, haciendo la vida más fácil a los humanos.

Casi 40 años después, tan sólo unas cuantas personas, a no ser por uno que otro inventor excéntrico, han tenido el "placer" de hablar con sus refrigeradores y hornos de microondas, o llamar por teléfono a su computadora personal desde un embotellamiento para ordenarle que encienda la calefacción en anticipación a su llegada a casa. Es indudable que, a pesar de los avances en diversos campos de la tecnología, en general hemos conservado nuestros tradicionales teclados QWERTY de la era victoriana, pues las tecnologías de captura alternas no han probado ser lo suficientemente confiables. Si alguna vez ha tratado de utilizar software comercial de reconocimiento de voz para dictar una carta, entonces sabe lo que es llegar a odiar la tecnología.

En el terreno de la interacción entre clientes y proveedores, un intercambio verbal con sistemas automatizados es algo casi tan fuera de lo común como encontrarse una gallina con dientes. A no ser que cuente las veces que se ha soltado gritándole improperios al teléfono al escuchar aquella insufrible música mientras lo tienen esperando en la línea, o mientras el sistema le recita a paso de tortuga una letanía interminable de opciones.

Poco a poco se ha venido introduciendo al público al mundo del reconocimiento automatizado de voz para realizar operaciones básicas, pero tales encuentros por lo general son bastante rudimentarios. Todavía se nos obliga a seguir por caminos estrictamente cercados, negociados utilizando órdenes enunciadas en forma clara y tersa, o el régimen estructurado de opción múltiple con tonos activados desde el teclado del teléfono. Y eso nos hace rabiar. Lo que la gente quiere es flexibilidad para realizar varias tareas sin tener que volver a navegar por el sistema de menús o, mejor aún, no tener que navegar en absoluto por el sistema de menús.

Y, por otro lado está la molestia de tener que reiterar la información. Repetir detalles previamente ingresados en el teclado del teléfono y regurgitar nuestra situación a un agente tras otro fue identificado por Accenture en fechas recientes como el segundo aspecto más molesto de tratar con un centro de contacto (el aspecto más molesto fue tener que esperar demasiado tiempo en la línea). Y ni hablar de tener que reiterar la información. (¿Ve cómo sí es molesto?)

Sistemas de reconocimiento de voz mejorados, tecnología avanzada de reglas de negocios y software basado en procesos pueden atacar estas dos deficiencias. Capturar información, reconocer palabras y frases clave y almacenar información crítica proporcionada en el punto de ingreso para utilizarla después ya es toda una realidad. El lenguaje humano natural es un campo atrozmente complicado (además de los acentos internacionales, no hay que olvidar las variaciones de acento entre una región y otra, así como las expresiones idiomáticas), pero las compuertas ya están abiertas y todos sabemos lo que ocurre con la tecnología una vez que la bola se echa a rodar.

Las tecnologías emergentes no sólo son más capaces de entender el lenguaje cotidiano, permitiendo un diálogo natural, casi humano, entre consumidores y computadoras; además reconocen datos que pueden ayudar a determinar — de antemano– lo que el cliente querrá hacer a continuación y almacenar información para usarla más adelante. De esta manera se elimina la necesidad de repetir.

Ya se encuentran en etapa de desarrollo e implantación sistemas automatizados de diálogo para las organizaciones más visionarias. Estos sistemas pueden entender instrucciones enunciadas utilizando lenguaje natural y/o la palabra escrita electrónica. Considerando los beneficios y la creciente impaciencia e insatisfacción del público con los esquemas "tradicionales" del call center, la adopción de esta nueva tecnología resulta incomprensiblemente lenta.

Las empresas utilizan sistemas de respuesta interactiva de voz (IVR) porque ahorran dinero – mucho — al canalizar a los clientes al departamento (casi siempre) correcto y liberando a los agentes de tener que atender tantas llamadas automatizando esas labores mundanas, de modo que no haya intervención humana.

¡Imagine cuánto más dinero se ahorrará con la implantación de tecnologías de reconocimiento de voz natural! Y ni hablar del aumento en la retención de agentes de primera calidad, empáticos, capaces de entablar una relación con aquellos clientes con los que sí tengan contacto, y la impresión tan positiva (alias fidelidad, alias recomendación de boca en boca) de los clientes que ya no tendrán que padecer el odiado suplicio.

En el mundo de los centros de contacto, los sistemas de reconocimiento de voz natural le permiten al cliente atenderse a sí mismo conforme a sus propias metas y directrices. No hay necesidad de que el cliente construya un complejo modelo mental para ubicar dónde se encuentra dentro de un servicio; debe poder saltar ágilmente entre enunciar su objetivo y proporcionar los datos necesarios.

Lo que es más, con esta tecnología los usuarios pueden interactuar con los procesos de negocios de una empresa a través de diversos canales, por ejemplo teléfono, correo electrónico o mensajes de texto. Incluso pueden entablar una sesión de mensajes instantáneos con un agente virtual, sin necesariamente percatarse de que no hay un representante de servicio humano en el otro extremo. Lo que esto significa es que los clientes pueden utilizar sus equipos favoritos para comunicarse con sus proveedores — sin tener que hacer cola para realizar una transacción sencilla, o ser transferidos con una persona para casos fuera de lo común o delicados.

Este último punto es crucial. Si se le da la oportunidad de escoger, la mayoría de la gente todavía prefiere hablar con una persona o con una interfaz cuasi-humana que con una máquina. Este problema puede abordarse de dos maneras. Se puede hacer que los agentes virtuales “cobren vida”: ya están surgiendo tecnologías que imparten a los agentes virtuales un cierto sentido de habilidad, intelecto, capacidad de respuesta y conciencia humanos — incluso se les puede animar para darles una “presencia” virtual, dándoles una apariencia antropomórfica. Se les puede dar incluso reacciones faciales sutiles que correspondan al tono vocal del cliente: una sonrisa, una expresión de confusión o de preocupación, por ejemplo.

La extensión natural de esta humanización de los agentes virtuales es “aparejar” a este “avatar” cuasi-humano con el cliente. Así como las sucursales cultivan la familiaridad y, en la mayoría de los casos, la confianza en las personas, también es posible imitar este patrón por medio de la tecnología. Los agentes virtuales pueden tener una personalidad (la que tenemos en nuestra oficina se llama Sara, tiene veintitantos años, acento escocés, cabello castaño corto y una expresión facial muy tranquila y agradable). El número de posibles personalidades es infinito. Un agente virtual (ya sea que se trate de una presencia exclusivamente vocal o de un avatar hecho y derecho) puede ser hombre o mujer, con casi cualquier acento, timbre de voz, etc. Los clientes pueden diseñar su propio agente virtual personalizado y (aquí viene lo mejor) pueden ser canalizados automáticamente a él (o ella) la próxima vez que se comuniquen a la empresa.

El otro enfoque, complementario al deseo natural de la gente de tratar con otro ser humano, consiste en fusionar los procesos del centro de contacto a través de un flujo de trabajo, de tal modo que las opciones de autoservicio se integren en forma imperceptible y transparente con los agentes humanos para conformar una capacidad de servicio unificada.

La fusión de agentes virtuales y humanos no queda ahí. Los agentes virtuales son ideales para atender las tareas más mundanas, repetitivas y de fácil automatización. La llamada telefónica o sesión de chat puede entonces ser transferida a un agente humano, quien recibe una transcripción del contacto hasta ese momento y puede continuar con el contacto una vez que se ha familiarizado con los detalles (una vez más, no es necesario repetir información). De hecho, en el caso del canal de chat de texto, el cliente no necesita saber que está siendo transferido de un agente virtual a un agente humano, quien podría resolver el problema antes de devolver el contacto al agente virtual.

Esto significa que los representantes de servicio humanos deberán ir ascendiendo en la cadena de valor, aplicando su intelecto en donde el intelecto humano más se necesita, y disponiendo de agentes automatizados para encargarse de las nimiedades. De cualquier manera se requiere que haya un agente humano a la mano para los procesos más complicados o inusuales, como por ejemplo resolución de conflictos, atención de quejas y manejo de excepciones.

* Dr Iain McKay, Director de investigación de lenguaje Graham Technology
* Andrew Ferguson, Gerente de comunicaciones