Inicio Articulos. Un acto de equilibrismo: Uso de tonos y reconocimiento de voz

Un acto de equilibrismo: Uso de tonos y reconocimiento de voz

Por

diciembre 1, 2006

Revista Mundo-Contact

La tecnología de reconocimiento de voz avanza con gran rapidez, y en la actualidad las empresas están poniendo la mirada en las tecnologías de voz para brindar mayores niveles de calidad en el servicio al cliente que lo que pueden ofrecer los sistemas tradicionales a base de tonos (“touchtone”).

Los índices de aceptación de reconocimiento de voz entre los consumidores también aumentan día tras día. De hecho, el 85% de la gente afirma que la voz es más fácil de usar que los tonos y 90% considera que el reconocimiento de voz aporta valor a las interacciones telefónicas.

Un acto de equilibrismo: Uso de tonos y reconocimiento de voz

Mark Turner*

Es muy probable que la mayoría de las personas que usted conoce hayan tenido alguna experiencia utilizando un sistema telefónico automatizado habilitado para reconocimiento de voz (por ejemplo, “Diga su número de cuenta”). La tecnología de reconocimiento de voz avanza con gran rapidez, y en la actualidad las empresas están poniendo la mirada en las tecnologías de voz para brindar mayores niveles de calidad en el servicio al cliente que lo que pueden ofrecer los sistemas tradicionales a base de tonos (“touchtone”). Los índices de aceptación de reconocimiento de voz entre los consumidores también aumentan día tras día. De hecho, el 85% de la gente afirma que la voz es más fácil de usar que los tonos y 90% considera que el reconocimiento de voz aporta valor a las interacciones telefónicas.

Sin embargo, muchos centros de contacto aún dependen por completo del sistema de tonos tradicionales para atender las interacciones con sus clientes, aún cuando estén implementando o migrando a reconocimiento de voz. Para algunas, ingresar información por medio del teclado es una necesidad por razones de seguridad o legales; para otras es cuestión de preferencia. En cualquier caso, puede resultar benéfico emplear ambas tecnologías, pero la clave consiste en saber cómo “casar” estas dos diferentes modalidades de ingreso de información para que el cliente perciba una experiencia automatizada perfectamente integrada.

Reconocimiento de voz y tonos: Dos experiencias distintas para el cliente

Los centros de contacto que migran de aplicaciones de tonos a voz o que desarrollan nuevas aplicaciones de autoservicio utilizando reconocimiento de voz a menudo suponen que la misma arquitectura de flujo general de llamada y las mejores prácticas de uso que se aplican a tonos pueden aplicarse a sistemas de reconocimiento de voz. En realidad, la experiencia de un cliente en una aplicación habilitada para reconocimiento de voz en comparación con una aplicación que sólo usa tonos es muy distinta, y el cliente tiene expectativas diferentes para un sistema de voz que para uno de tonos.

Sostener una “conversación” con un sistema que únicamente se vale de tonos es algo mecánico y, en general, no intuitivo. El cliente sólo puede interactuar con el sistema escuchando instrucciones y proveyendo una respuesta mecánica (usar las teclas del teléfono), dentro del contexto muy limitado que brindan las opciones del menú.
Cuando un cliente interactúa con una aplicación de voz, inconscientemente compara la experiencia con sostener una conversación con una persona de verdad, aun cuando esté plenamente consciente de que se trata de un sistema automatizado. Por eso, el cliente fija una expectativa más elevada para el sistema habilitado para voz, muy similar a la expectativa que tiene cuando habla con un agente en vivo.

El que llama percibe un mayor nivel de control con reconocimiento de voz, e incluso tiene un modelo mental preexistente sobre cómo se va a desarrollar la conversación, con base en sus experiencias anteriores con representantes de servicio. Si el flujo de la llamada no discurre en paralelo al modelo mental que tiene el cliente, éste tiende a interrumpir al sistema para pedir lo que quiere. Los mejores sistemas habilitados para voz le van guiando sin obstrucciones, sin sacrificar esa sensación de control o naturalidad de la conversación.

El reconocimiento de voz le permite a un sistema automatizado aprovechar la capacidad natural que tiene el cliente para expresarse a través del lenguaje oral y la conversación para brindarle una experiencia mejor y más natural. El propósito no consiste en hacer creer al cliente que está hablando con una persona de carne y hueso, sino evitar llegar a los temibles “deal breakers”, esos puntos en los que el flujo del diálogo se torna tan incómodo o poco natural que el cliente empieza a fijarse más en el sistema que en la operación que necesita realizar.

Cómo casar felizmente los tonos y el reconocimiento de voz

Al crear un sistema de centro de contacto que incorpore tanto reconocimiento de voz como tonos, se necesita diseñar primero la parte de voz, y luego incorporar los tonos al diseño como una característica secundaria.

Siempre que sea posible, el sistema debe soportar tonos como modo alterno de ingreso de información. Se debe evitar cambiar aleatoriamente entre sólo voz y sólo tonos, pues esto puede confundir al cliente. Por ejemplo, si el sistema exhorta al usuario a decir sus datos, el cliente debe poder decirlos o ingresarlos mediante el teclado, lo que él o ella prefiera.

Sistema: Por favor dígame los diez dígitos de su número telefónico de casa. Cliente: 6504492350
o bien Sistema: Por favor dígame los diez dígitos de su número telefónico de casa. Cliente: [El cliente usa el teclado de su teléfono para ingresar: 6504492350# ]

La tecnología de tonos también puede ser una excelente “opción de respaldo” para el reconocimiento de voz. La precisión de un sistema de reconocimiento de voz bien diseñado y puesto a punto puede ubicarse en el 90º percentil. Sin embargo, a los sistemas de reconocimiento de voz les puede costar trabajo reconocer con exactitud lo que está diciendo el cliente, en especial si se encuentra en un lugar donde hay mucho ruido, en un teléfono móvil o en modalidad de manos libres, o si tiene un acento o característica vocal que plantee un reto adicional al software de reconocimiento.

Cuando se presenten errores en el reconocimiento, el diseño del diálogo debe ofrecerle al cliente mensajes de error específicos para el contexto en que se encuentra y ordenados de manera jerárquica; cada nivel debe presentarle instrucciones nuevas o adicionales tendientes a orientarlo hacia el uso de la modalidad de respaldo, es decir, la función de tonos.

Sistema: ¿Sobre qué tipo de cuenta es su consulta – CHEQUES, AHORROS, o INVERSIONES? Cliente: Llamo sobre mi cuenta de cheques. [mucho ruido de fondo]
Sistema: Disculpe, no entendí. Por favor diga CHEQUES, AHORROS, o INVERSIONES. O bien, si está llamando para alguna otra consulta, diga OTROS. Cliente: ¡Cheques! [mucho ruido de fondo] Sistema: Disculpe, pero sigo sin entender correctamente. Intentemos con el teclado de su teléfono. Para cheques, por favor oprima 1. Para ahorro, oprima 2. Para inversiones, oprima 3. Para cualquier otra consulta, oprima 4. Cliente: [El cliente oprime 1 en el teclado del teléfono]

Evite redactar instrucciones del tipo “Para cheques, diga u oprima 1”, que ni suenan naturales desde el punto de vista conversacional, ni ayudan a acotar eficazmente las posibles respuestas del cliente. Aunque esta instrucción le indica al cliente que simplemente diga “uno”, muchos clientes de cualquier manera proporcionan una gran variedad de respuestas a un sistema de reconocimiento de voz, dependiendo de lo que les parezca más natural en ese contexto de conversación (por ejemplo, “llamo para hacer una consulta de mi cuenta de cheques”).

Por motivos de seguridad o legales, algunas empresas exhortan, e incluso exigen a sus clientes, que ingresen datos vía tonos, como por ejemplo fecha de nacimiento, números de cuenta, confirmaciones, etc. Dependiendo de los requerimientos jurídicos o de seguridad, se puede diseñar el sistema para orientar al cliente a usar tonos, pero reconocer voz o tonos como medio válido para ingresar información, o guiar al cliente hacia el uso de tonos y aceptar este medio como la única modalidad válida. Si es obligatorio usar tonos, las instrucciones en caso de error necesitan orientar claramente al cliente en caso de que intente usar reconocimiento de voz en lugar de tonos.

Satisfacer las expectativas

A fin de brindar la interacción esperada, las aplicaciones, tanto de reconocimiento de voz como de tonos, necesitan aportar valor para quien llama.

En el caso de voz, es importante anticipar lo que el cliente va a decir en un momento dado dentro del diálogo e incorporar esos enunciados en el archivo de gramática de reconocimiento que esté activo en ese momento en la aplicación. A diferencia de los tonos, donde hay un número muy acotado de opciones, si las instrucciones y reglas gramaticales de reconocimiento de un diálogo están mal diseñadas, el cliente podría terminar diciendo cosas que el sistema no reconoce. Recuerde que los “deal breakers” destruyen el ritmo natural de la interacción y el cliente siente que el sistema no ha estado a la altura de sus expectativas.

Con la tecnologías de reconocimiento de voz, se trata de consumar un acto de equilibrismo que garantice que existen un número suficiente de enunciados en las listas de reglas gramaticales para maximizar la cobertura (es decir. que lo que el cliente dijo esté contenido en la gramática) y, al mismo tiempo, no sobrecargar las reglas gramaticales con tantas posibilidades que se vulnere la exactitud (es decir, que lo que el cliente dijo esté contenido en la gramática y sea correctamente cotejado como tal por el sistema de reconocimiento). Con tonos, el limitado número de opciones a menudo puede eliminar la incertidumbre de la cobertura de las reglas gramaticales y maximizar la exactitud pero, al mismo tiempo, brindar una interacción menos satisfactoria para el cliente.

Si decide fusionar sus aplicaciones de tonos y reconocimiento de voz, no olvide evaluar a sus clientes y sus expectativas, así como los requerimientos de negocios de su empresa, teniendo en cuenta que la meta es ofrecerle al cliente la mejor manera de acceder al autoservicio mediante un sistema telefónico automatizado. Todos los sistemas reportan el mejor ROI cuando se les diseña para solucionar los requerimientos de negocios, para ser congruentes con las necesidades y expectativas del cliente, y para ofrecer una interfaz conversacional, intuitiva y útil que represente la marca de la empresa.

*Mark Turner, Director general para Gran Bretaña e Irlanda, Genesys

Un acto de equilibrismo: Uso de tonos y reconocimiento de voz

Acervo de noticias sobre Inteligencia Artificial

Microsoft crea servicio ultra secreto de IA para espías de EU

La era de la música con IA ya está aquí

El cine abraza la inteligencia artificial

La preocupación de Microsoft por el liderazgo de Google impulsó la...

Búsquedas en TikTok revelan canciones generadas por IA de Taylor Swift

Lo más popular en MC

Nuevo iPad Pro: ¿un verdadero reemplazo de la computadora portátil?

Búsquedas en TikTok revelan canciones generadas por IA de Taylor Swift

Huawei financia investigaciones de vanguardia en universidades de EU

El cine abraza la inteligencia artificial

El iPad Pro será la estrella en el próximo evento de...