Inicio Articulos. Cómo obtener una aplicación exitosa de reconocimiento de voz

Cómo obtener una aplicación exitosa de reconocimiento de voz

Revista Mundo-Contact

    Cómo obtener una aplicación exitosa de reconocimiento de voz Emilio Gandarilla*

Una situación muy frecuente en México y Latinoamérica ha sido, sin duda, que al mencionar tecnología de reconocimiento de voz, a clientes y proveedores involucrados en proyectos del género, les viniera automáticamente en mente la imagen de promesas no cumplidas y un fuerte sentimiento de frustración.

En los últimos años, las tecnologías de reconocimiento de voz han evolucionado significativamente, de ser aplicaciones que sólo lograban reconocer un "sí", "no" o un número, a la tecnología actual, que puede entender un diálogo natural. La nueva generación de aplicaciones de reconocimiento de voz tiene como clave de su éxito el hecho de que el software debe entender el concepto que el usuario está tratando de transmitir cuando habla o dice una frase. Se trata de lo más aproximado a la forma como hablamos con los demás, y al modo como nuestro cerebro interpreta lo que está escuchando. Así, los usuarios no tienen que restringirse a expresar lo que quieren a partir de un patrón previamente diseñado, sino que se expresan normalmente como si hablaran con otra persona. Por ejemplo, si alguien dice: "tengo un problema con mi computadora", "mi computadora está fallando", "mi computadora se trabó", "la computadora tiene una pantalla azul", la aplicación de reconocimiento de voz entiende que lo que el usuario desea es hablar con alguien que le pueda ayudar a resolver un problema con su computadora, por lo que la llamada deberá transferirse a soporte técnico.

También ya es posible incluir un guión automatizado que vaya orientando al usuario para que él mismo pueda resolver fallas sencillas, sin que necesite intervenir un asesor por el teléfono.

En el mercado existen soluciones que simplifican el proceso de desarrollo de aplicaciones de reconocimiento de voz por medio de interfaces gráficas para programar las gramáticas correspondientes, pero el trabajo más importante para lograr una aplicación exitosa de reconocimiento de voz, debe hacerse antes de empezar la programación general. Dicho trabajo incluye un proceso previo de consultoría y de análisis del contexto en el cual va a funcionar la aplicación.

En el transcurso de dicho proceso, un psicólogo analiza el contexto en el que opera la organización, estudia el comportamiento de las personas que comúnmente utilizan el servicio en cuestión, y establece las posibilidades en las que los usuarios pueden interactuar con el servicio. Todo ello mediante una serie de entrevistas a operadoras, a recepcionistas y a las personas que más llamadas reciben dentro de la empresa. También se analizan grabaciones de las conversaciones más comunes dentro de la organización.

El resultado de este trabajo inicial da la pauta para hacer la programación de la aplicación, lo que hace más sencillos y eficientes los procesos de desarrollo e implementación.

La actual tecnología dispone de una herramienta gráfica de desarrollo, que reduce el tiempo, aumenta la confiabilidad del software generado, y permite que todas las palabras y frases que deba reconocer la aplicación sean insertadas por medio de una interfaz gráfica. Además, hace factible que las aplicaciones vayan más allá de los tradicionales operadores automáticos o directorios asistidos, al hacer aplicaciones muy complejas que partan de una premisa básica, por ejemplo: "dígame en qué puedo ayudarlo". En este caso el usuario contesta explicando el motivo de su llamada: la aplicación de reconocimiento de voz debe ser capaz de responder, en forma eficaz, a cualquier petición formulada en lenguaje natural, transfiriendo la llamada al área de servicio correcta o directamente a la persona adecuada que pueda responder a la petición del cliente.

Las soluciones basadas en estándares abiertos, permiten una integración sencilla con equipos propios o de otros fabricantes, sean de generación anterior, basados en voz tradicional, o de nueva generación basados en voz sobre IP.

Por medio de este nuevo paradigma, ahora es posible implementar aplicaciones de reconocimiento de voz que funcionen en forma correcta, con soporte local, y que mejoren la operación y la imagen de las organizaciones ante sus clientes.

*Ing. Emilio Gandarilla es Subdirector Comercial de Sixbell Nekotec Solutions

 

La nueva generación de aplicaciones de reconocimiento de voz tiene como clave de su éxito el hecho de que el software debe entender el concepto que el usuario está tratando de transmitir cuando habla o dice una frase. Se trata de lo más aproximado a la forma como hablamos con los demás, y al modo como nuestro cerebro interpreta lo que está escuchando.