El equipo de Google Brain presentó sus avances en agentes conversacionales, que pretenden superar las fallas críticas que presentan en la actualidad muchos chatbots: sus respuestas no siempre tienen sentido, ya sea por ser inconsistentes o bien por no encajar en el contexto de la conversación.
Meena es una red neuronal entrenada para minimizar la perplejidad, la incertidumbre de predecir la siguiente palabra en una conversación, según explica Google AI. Para esto, sus responsables emplearon una arquitectura denominada ‘transformador evolucionado secuencia a secuencia’, que lo que hace es que el modelo codifique la secuencia de entrada –la oración al traducir– y decodifique la secuencia de salida –la traducción–.
En concreto, Meena emplea un bloqueador codificador que procesa el contexto de la conversación para que el modelo pueda entenderlo y trece bloques de codificadores para formular una respuesta real. El equipo de Meena descubrió que un codificador más potente era la clave para una calidad conversacional más alta.
Meena emplea 2,600 millones de parámetros y ha sido entrenada con 341 GB de texto, procedentes de conversaciones públicas en redes sociales. En comparación con los modelos más avanzados existentes, el modelo que propone el equipo de Google Bain tiene una capacidad 1.7 mayor y ha sido entrenado con 8.5 veces más datos.
Todo esto permite que Meena pueda mantener conversaciones ‘mucho más apropiadas y específicas que los chatbots avanzados existentes’.
Esto ha sido medido con una nueva métrica de evaluación humana, denominada ‘sensibilidad y especificidad promedio’, que captura los atributos básicos, pero importantes para conversaciones naturales.