Inicio Tecnología 2017 Articulos 2017 Aspectos fundamentales en la implementación de un Sistema de Reconocimiento de Voz

Aspectos fundamentales en la implementación de un Sistema de Reconocimiento de Voz

Mundo-ContactAspectos fundamentales en la implementación de un Sistema de Reconocimiento de Voz

*Valdir Ugalde

Con el propósito de obtener una visión amplia en torno a la tecnología de Reconocimiento de Voz (IVR, por sus siglas en inglés) y sus implicaciones dentro de las organizaciones, Mundo-Contact realizó una entrevista con Valentine Matula, Director Multimedia Technologies Research de Avaya labs.

Tendencias en la implementación de soluciones IVR

Valentine Matula explica que la adaptación de las soluciones de Reconocimiento de Voz dentro de las empresas depende, en primera instancia, del mercado que se trate. En este sentido, en países como Estados Unidos y el Reino Unido esta tecnología se ha desarrollado a un nivel más rápido, debido a que existen competidores que se encuentran en la misma vertical, tratando de mantenerse a la vanguardia. Matula resalta que es el sector financiero en el cual se han apreciado mayores avances.

Por otra parte, un elemento determinante para que las empresas adopten estos sistemas es el costo de la mano de obra: si ésta es cara, las empresas tendrán una mayor motivación para implementarlos. En cambio, en aquellos países en los que Reconocimiento de Voz resulta muy costoso (y no así los agentes telefónicos) la motivación será menor. Un ejemplo de lo último es La India, país en el cual esta tecnología no ha crecido, debido a que la mano de obra es muy barata. En este aspecto, Matula considera que Latinoamérica se encuentra en un punto medio.

Otro factor importante es el cultural. Matula explica: “En Estados Unidos, obtener el saldo de la cuenta bancaria es algo para lo cual la gente prefiere no hablar con un ser humano, especialmente si está en el borde de su límite de crédito: le da vergüenza y prefiere utilizar un sistema automatizado. Por el contrario, un seguro de vida es algo con lo que las personas no se sienten tan cómodas si obtienen las respuestas de un sistema automatizado, y por lo tanto prefieren hablar con una persona”.

También deben tomarse en cuenta los diferentes perfiles de consumidores que existen en el mercado. Al respecto, Matula relata una anécdota interesante: “Hicimos un proyecto con una agencia que atiende a los militares en Estados Unidos. Lo que encontramos es que un porcentaje de personas llama con una alta disposición a utilizar el IVR. Sin embargo, también existe otro grupo, el de los jubilados, al cual no le gusta utilizar el sistema automatizado porque terminaría muy rápido: quieren un agente para poder hablar sobre el clima, el último juego de los Yankees, etc.”

Asimismo, Matula comenta que, si realmente se desea reducir el tiempo de los agentes, es necesario encontrar la mejor manera de integrar la base de datos corporativa con el sistema. “Mientras más complicado sea esto, más caro será el proyecto, y menor valor tendrá el quitarle la llamada al agente”, asegura. En este sentido, las empresas que cuentan con interfases Web o accesos estructurados a los sistemas de bases de datos, tendrán menor dificultad para llevar a cabo esa integración, en comparación con aquéllas que operan con mainframes de legacy antiguo.

En opinión del entrevistado, la implementación del Reconocimiento de Voz comenzará a crecer como una herramienta de negocio, a medida que la mano de obra se encarece, los consumidores esperan un acceso permanente a su información personal, y algunas industrias comienzan a adoptar esta tecnología.

Condiciones para la implementación de un sistema de Reconocimiento de Voz

De acuerdo con Matula, existen diversas condiciones para que un sistema de Reconocimiento de Voz se justifique y pueda operar eficientemente. En primer lugar, el usuario debe estar motivado a utilizarlo para realizar ya sea una consulta o una transacción.

En segundo lugar, el sistema debe ser sencillo de utilizar: los sistemas touch-tone son efectivos para algunas aplicaciones sencillas, mientras que el IVR resulta más conveniente cuando hay que elegir a partir de una lista, o cuando se ofrecen productos o servicios que implican una infinidad de opciones (por ejemplo, los destinos de una aerolínea).

En tercer lugar, se debe tomar en cuenta la conveniencia de contratar a un agente, en comparación con utilizar el sistema automatizado. Matula hace especial referencia a los servicios financieros: “Si una persona desea conocer su saldo, llama al banco y se lo dan, se ha conseguido el objetivo. Sin embargo, si el banco descubre a través de su base de datos que esa persona tiene mucho dinero, y que todo éste se encuentra en una cuenta de ahorros, entonces el sistema puede dirigir a la persona con un agente que le explicará que el banco también ofrece fondos de inversión y acciones, y que un asesor financiero le puede ayudar a diversificar su dinero para obtener mayores intereses. Ésa es la oportunidad perdida si se efectúa la operación con el sistema automatizado.”

Asimismo, el entrevistado opina que, en algunos casos, resulta conveniente combinar el uso de agentes con el sistema automatizado. Algunas empresas fabricantes de ciertos productos dan mucha importancia a los agentes telefónicos, porque éstos tratan de incrementar el valor de la venta o realizar ventas adicionales. Sin embargo, una vez hecho el pedido, si el cliente llama para preguntar sobre el status de éste, se puede utilizar el sistema automatizado, ya que esa llamada no representa una oportunidad de venta.

La importancia de la infraestructura tecnológica

Matula afirma que existe una amplia variedad de configuraciones tecnológicas para la aplicación de sistemas IVR. Lo más sencillo son los sistemas automatizados que no cuentan con CRM, ni con CTI, sino que sólo preguntan con qué área necesita hablar la persona que llama. Al respecto, el entrevistado opina que este sistema no representa muchas ventajas.

En un nivel más avanzado, existe un vínculo con la base de datos y los sistemas corporativos. De esta forma, se le puede informar a la gente sobre el status de su pedido y es posible hacer transacciones automatizadas, entre otras operaciones. En opinión de Matula, el problema con esta infraestructura es que, si la persona que llama sólo llega a realizar la mitad de la transacción y la empresa no cuenta con CTI, hay que transferir la llamada con un agente que no sabrá lo que la persona estaba haciendo, y será necesario empezar desde el principio. “Mi recomendación sería que, si una empresa tiene un proyecto de Reconocimiento de Voz, se fije en el CTI, porque esta aplicación ayudará a todos sus clientes conforme utilizan el sistema”, afirma.

Por otro lado, Matula considera que las mejores empresas dividen el trabajo de cada llamada entre el IVR y el agente. Por ejemplo, el primero le pide al cliente su número de cuenta, le pregunta qué desean hacer y procura que continúe utilizando el sistema. Si el cliente no puede llegar más lejos, es transferido con un agente telefónico que hace el resto de la transacción. Esto reduce el trabajo de los agentes y los deja concentrarse en las tareas más complicadas.

¿Cómo aprovechar la infraestructura tecnológica actual?

Las empresas cuentan actualmente con una variedad de herramientas tecnológicas, de las cuales algunas pueden ser utilizadas en la implementación de un sistema de Reconocimiento de Voz.

En el caso de las organizaciones que cuentan con un sitio Web, pero no ofrecen venta de productos o servicios a través de éste, es necesario conectar el IVR al mainframe de negocio. Según afirma Matula, ello implica realizar conexiones más complejas y caras.

Por otra parte, si la empresa cuenta con toda una infraestructura de ventas en la Web, sólo es necesario construir sobre ella, logrando que el sitio Web envíe información al IVR. Éste es, para el entrevistado, el proceso más sencillo y conveniente.

Obstáculos en la implementación de un sistema IVR

Existen diversos factores que pueden representar un freno para que las empresas adopten un sistema IVR. Uno de ellos es que esta tecnología no se ajuste a las necesidades del negocio, debido al tipo de producto o servicio que ofrecen.

Otro de los obstáculos, explica Matula, es el hecho de que se requiere cierto nivel de expertise para construir un sistema automatizado de voz que realmente funcione y satisfaga a los clientes. Además, se necesitan más computadoras y más hardware para reconocer la voz, y las licencias tienen un costo de varios cientos de dólares. Todo ello hace que, en resumen, sea más caro instalar este tipo de tecnología que, por ejemplo, una basada en touch-tone.

Por otro lado, en Estados Unidos la gente está acostumbrada a efectuar una transacción completa en la Web, y tiene confianza en el funcionamiento de los sistemas. Sin embargo, Matula cree que deben existir experiencias menos satisfactorias en otros países, debido a factores independientes al sistema IVR, como fallas en la entrega de pedidos o falta de comunicación interna y externa de las empresas. Además, comenta el entrevistado, es necesaria una migración cultural. “La práctica hace la perfección. En un principio, la gente en Estados Unidos no sabía utilizar muy bien los sistemas de Reconocimiento de Voz, pero mientras más lo usaba, más se entrenaba, y de esta forma el nivel de precisión aumentó. En países donde la gente nunca ha utilizado estos sistemas, tomará tiempo que ésta se acostumbre.”

Finalmente, aunado a lo anterior, resalta el hecho de que ni los gerentes ni los clientes están aún familiarizados con la efectividad del sistema, a pesar de que éste funciona bastante bien.

El funcionamiento general de los sistemas de Reconocimiento de Voz

Matula explicó, a grandes rasgos, cómo se configura un sistema de Reconocimiento de Voz.

El primer paso, afirma, consiste en grabar a la gente mientras habla. Posteriormente, las palabras recogidas son seccionadas dentro de un laboratorio. “Por ejemplo, la palabra ‘Hola’ se divide en ‘Ho’ y ‘la’, y de esta forma se arman muestras acústicas. Es necesario tomar en cuenta que cada persona, dependiendo de diversos factores como su origen, raza, género, entre otros, pronunciará las palabras de diferente manera”, señala.

El segundo paso se relaciona con la gramática: el sistema trata de reconocer y hacer coincidir lo que está escuchando, de acuerdo con los patrones que contiene. Si no reconoce ninguna de las palabras, las rechaza. En el caso específico de los números, Matula hace notar que, se ha tratado tanto tiempo con ellos, que la probabilidad de que el sistema los reconozca es de 99.5% o mayor.

Finalmente, es necesario tomar en cuenta la comprensión del lenguaje natural. Es decir, la extracción de información a partir de la frase mencionada por una persona. Por ejemplo, cuando se recibe una llamada, si el sistema pregunta “¿cuál es la razón de su llamada hoy?”, la persona puede responder “hablar con la operadora”, o bien “necesito hablar con alguien porque necesito un préstamo para hacer una compra grande”. La palabra “préstamo” hace ver al sistema que no se trata de una hipoteca o de una cuenta de cheques, sino de un préstamo.

Cómo hacer del IVR una experiencia más personalizada para los clientes

Matula considera que sí existen formas de “personalizar” una llamada que se realiza a través del IVR. Una de ellas, explica, consiste en mejorar el tono y las palabras utilizadas por el sistema, para hacer el diálogo más amigable.

También se puede enlazar el sistema con una solución CRM. De esta manera, cuando el cliente llama, da su número de cuenta y especifica el motivo de su llamada, el sistema debe ser capaz de consultar la información contenida en el CRM. “Si las últimas tres veces que el cliente llamó fueron para preguntar si un paquete que envió ya había llegado a su destino, ésta vez el sistema debería decir desde un principio: ‘su paquete sobre el cual llamó la última vez está en tránsito y está confirmada su llegada el martes’. Entonces el cliente puede colgar en ese momento o solicitar otro servicio. Ése es el nivel de personalización que le gusta a la gente”, afirma Matula.

Cómo justificar la inversión que implica un sistema IVR

El entrevistado opina que, si un gerente desea implementar uno de estos sistemas en su empresa, es necesario que lo justifique enfocándose en el servicio al cliente, y no en el IVR como tal. “El proyecto debe abordarse teniendo en cuenta el mejoramiento del servicio al cliente, ya sea recolectando información para que tenga una mejor experiencia con el agente una vez que llega a él, u ofreciendo servicio las 24 horas, para que no tenga que esperar a un agente”, señala.

Finalmente, Matula comentó que algunas empresas prefieren aplicar los sistemas de Reconocimiento de Voz primero entre sus empleados. De esta forma, pueden experimentar con servicios relacionados con Recursos Humanos y, si tienen éxito, implementan el sistema con sus clientes.

Para concluir, Matula afirma: “Para construir un sistema automatizado de voz, sólo se requiere ser efectivo y usar las herramientas que estén disponibles; no importa que sean económicas, siempre y cuando funcionen.”

* Valdir Ugalde. Mundo-Contact

Opinión