Inicio Articulos. Guía práctica del reconocimiento de voz. 1a. parte

Guía práctica del reconocimiento de voz. 1a. parte

Guía práctica del reconocimiento de voz. 1a. parte
Utilice el reconocimiento de voz para abatir sus costos y aumentar sus ingresos

Por Donna M.Fluss*

Resumen ejecutivo
El reconocimiento de voz es una tecnología que, cuando se utiliza correctamente, permite a las empresas abatir costos y aumentar sus ingresos. Aunque la tecnología está lista para el estrellato, la adopción generalizada continúa demorándose debido a que hay muy pocos expertos en la elaboración de guiones e interfaces de usuario. El retorno de la inversión en tecnologías de reconocimiento de voz es muy atractivo en ambientes de atención al cliente, empresa a empresa y empresa a empleado. El autoservicio tiene cada vez más demanda y el reconocimiento de voz proporciona una solución comprobada para la mayoría de las necesidades de negocios.

Este documento es una guía práctica para los ejecutivos que están considerando los beneficios, retos y oportunidades que plantea el reconocimiento de voz y explora las muchas aplicaciones y usos de esta tecnología en las empresas, tanto dentro como fuera del Centro de Contacto. También explica la tecnología, presenta su propuesta de valor y ROI mediante casos de estudio, evalúa los riesgos y advierte sobre los escollos que hay que sortear. Los beneficios potenciales de la actual generación de aplicaciones de reconocimiento de voz superan por mucho a los riesgos, siempre y cuando el proyecto se implemente y administre correctamente.

Introducción

La tecnología de reconocimiento de voz adolece de un problema: nadie le da su lugar. El reconocimiento de voz es una tecnología muy atractiva y rica en funcionalidad, con muchas aplicaciones tanto dentro como fuera de los Centros de Contacto, que brinda un ROI muy rápido, del orden de 6 a 12 meses, y sin embargo es difícil de vender. Más paradójico aún, se trata de una de las pocas, sino es que la única tecnología de autoservicio, que es intuitiva para el cliente, incluso sin capacitación, pues utiliza la forma más ubicua de comunicación: el habla. No obstante, las empresas siguen renuentes a invertir.

La atención al cliente se deteriora más y más a medida que el débil entorno económico somete a las empresas a una presión cada vez mayor por abatir costos. En contraposición, o acaso en respuesta, a esta realidad, a últimas fechas se ha publicado una serie de estudios que demuestran que, en 2002, el servicio al cliente era la iniciativa más importante para más de 65% de las empresas. Pero las inversiones no se han dado a la par de estas supuestas prioridades; las empresas ahorcan cada vez más los presupuestos de servicio al cliente y la calidad de la atención continúa en picada. El mercado de servicios está demandando tecnologías que, de manera simultánea, abatan costos y mejoren la calidad, y el reconocimiento de voz reúne estos requisitos. La tecnología de reconocimiento de voz es muy atractiva, en particular en una economía difícil que pretende hacer énfasis en la calidad del servicio, por lo que resulta paradójico que los proveedores en el mercado de reconocimiento de voz continúen batallando y que la mayoría aún no haya logrado dar el salto a la rentabilidad.

En todo el mundo, las inversiones en tecnología de reconocimiento de voz alcanzan hoy los US$650 millones y se espera que crezcan a US$5,600 millones en el 2006, de acuerdo con Datamonitor. El mercado está listo para el reconocimiento de voz y la propuesta de valor y beneficios económicos están más que claros, y sin embargo estos productos aún no alcanzan su potencial de ventas. El reconocimiento de voz debería ser tan común como los sistemas de respuesta interactiva de voz (IVR) y, en algunas empresas, de hecho debería reemplazar a las aplicaciones de IVR, pero esto simplemente no está ocurriendo a gran escala.

La tasa de adopción del reconocimiento de voz en ambientes de CRM y call centers, su principal mercado durante los últimos veinte años o más, ha sido penosamente lenta. La aceptación de las tecnologías de voz en áreas distintas a CRM en los últimos dos años, sin embargo, está rebasando la tasa de implementación en call centers y propulsará su éxito en esos terrenos durante los próximos cinco años.

Beneficios

Los beneficios de una aplicación de reconocimiento de voz implementada correctamente son enormes. Un proyecto de reconocimiento de voz efectivo recupera la inversión en su primer año. La condición (y siempre existe una) es que las aplicaciones de voz tienen que estar diseñadas desde la perspectiva del usuario, y la interfaz de usuario tiene que estar adaptada a la medida del público que la va a utilizar. Para ilustrarlo de manera muy burda, una aplicación diseñada para yucatecos no va a funcionar bien en Monterrey.

El reconocimiento de voz generalmente es considerado como una herramienta de productividad para el centro de contacto porque es ahí donde se han obtenido los mayores resultados en recuperación de la inversión, pero también ha demostrado ser eficaz para generar ingresos para la empresa dentro y fuera del centro de contacto. En lo que hace a la productividad, el reconocimiento de voz reduce las llamadas a los agentes, acorta la duración de las llamadas, reduce los tiempos de espera y abate las tasas de abandono de llamadas. La tecnología de reconocimiento de voz le permite a una empresa generar ingresos tanto al automatizar actividades que anteriormente requerían asistencia de un agente como al proporcionar nuevos servicios, incluyendo portales voz, marcación activada por voz y lectura de mensajes de correo electrónico.

Durante la recesión muchos call centers han hecho recortes y funcionan con el mínimo de personal, lo que se ha traducido en niveles inferiores de servicio. Cuando la economía se recupere y los volúmenes en los call centers aumenten, será necesario añadir rápidamente personal nuevo o tendrá que haber una inversión en nuevas tecnologías de autoservicio que le permitan al cliente atenderse a sí mismo.

El reconocimiento de voz puede beneficiar a las empresas ya sea que éstas cuenten o no con un sistema de IVR a base de tonos. Si el volumen de llamadas es lo suficientemente alto, incluso una compañía que ya tenga tasas de utilización del 80% para su sistema IVR de tonos puede cosechar grandes beneficios con el reconocimiento de voz. Según un informe publicado en abril de 2001 por Giga, la incorporación de capacidad de reconocimiento de voz a una plataforma IVR a base de tonos “incrementa la utilización entre 20% y 60%”.

Historia de la tecnología de reconocimiento de voz

La tecnología de reconocimiento de voz tiene una historia muy notable. En 1997, después de aproximadamente 20 años de desarrollo, el nivel de precisión del reconocimiento de voz dirigido, independientemente del hablante, rebasó la marca del 95%, lo que dio a las empresas la confianza para utilizarlo en call centers. (A un nivel de precisión del 95% el desempeño del reconocimiento de voz es comparable al de muchos agentes, ¡y muchas veces con mayor amabilidad!).

Desafortunadamente para los proveedores de soluciones de reconocimiento de voz, esta fue también la época en que despegó el Internet. Demasiadas empresas decidieron invertir en iniciativas de Web en vez de invertir en tecnología de reconocimiento de voz, aun cuando el rendimiento potencial de ésta era mayor. Todos sabemos lo que ocurrió con las inversiones en web una vez que la realidad se hizo presente, pero la desaceleración económica, seguida de la recesión, continúan ejerciendo una enorme presión en las empresas por minimizar las inversiones en nuevas tecnologías.

Una vez más, el reconocimiento de voz es víctima cuando debería ser algo indispensable. La tecnología de reconocimiento de voz está lista para el estrellato. Ha confrontado y superado muchos desafíos tecnológicos en los últimos cinco años. Entre las mejoras que ahora incorporan los sistemas están las siguientes:

1. Lograr un umbral de precisión del 96% al 98% de reconocimiento de voz dirigido independientemente del hablante.
2. Manejo de vocabularios de más de un millón de palabras.
3. Incorporación de la función de “interrupción” que hace el sistema más fácil de usar.
4. Disminución de los requerimientos de cómputo para las aplicaciones de voz.
5. 99% de exactitud utilizando verificación de voz en combinación con reconocimiento de voz.
6. desarrollo de interfaces que utilizan un lenguaje más natural y faciliten el uso del sistema.
7. Introducción de estándares de desarrollo VoiceXML que son independientes del proveedor.

Aunque la tecnología de reconocimiento de voz es viable, existen pocos proveedores primarios debido a que se requiere una cuantiosa inversión inicial. Los principales proveedores en tecnologías de voz en los Estados Unidos son Nuance,Speechworks e IBM. Fuera de E.U., particularmente en Europa, Philips es un contendiente fuerte pero no ha logrado tener éxito en E.U.

Continuará…