A pesar de su dominio en servicios al consumidor, Google, el gigante de las búsquedas propiedad Alphabet, ha estado muy por detrás de Amazon y Microsoft en la industria de computación en la nube.
Las empresas cloud compiten en varios diferentes (velocidad, funciones, confiabilidad), pero una parte clave del plan del director ejecutivo de Google Cloud, Tomas Kurian para ponerse al día, es convencer a los clientes de que la infraestructura de la nube de Google es más confiable que la de la competencia.
Cuando la red de computación en la nube de Amazon Web Services dejó de funcionar el 7 de diciembre, afectó a una amplia franja de empresas que dependen de sus servidores, incluidas Disney, Netflix y Ticketmaster.
Los analistas de la industria de la nube dicen que medir el tiempo de inactividad relativo de los servicios de la competencia es casi imposible, debido a la escala de las redes, la diversidad de los servicios que ofrecen y la combinación compleja de factores que conducen a fallas.
Corey Quinn, economista jefe de la nube en Duckbil Group, que trabaja con empresas para reducir sus facturas de AWS, dice que Amazon y Google Cloud están codo con codo con respecto a la confiabilidad, con Azure de Microsoft a la zaga debido importantes interrupciones en 2020.
El portavoz de Microsoft dice que la nube de la compañía ofrece confiabilidad líder en la industria y que otorgan los clientes créditos de pago después de algunas interrupciones.
Aún así, Google enfrenta sus propios desafíos técnicos. Cuando la empresa comenzó construir su sistema global de centros de datos, el objetivo era servir sus propios productos tecnológicos orientados al consumidor. Su diseño se adapta bien a la tarea de mantener la búsqueda, el correo electrónico y la transmisión de videos de Google funcionando en todo el mundo.
Pero el uso de las mismas granjas de servidores como columna vertebral de una red de computación en la nube, presenta un nuevo conjunto de complicaciones técnicas, y resolver esa tensión a sido un enfoque de ingeniería importante para Kurian.
La computación en la nube se encuentra en un segmento de la industria tecnológica donde todos anticipan un crecimiento desbocado. El mercado de la nube crecerá alrededor de un 30% anual hasta 2025, cuando alcanzará los 400 mil millones de dólares, según IDC.
En 2020, Amazon controlaba el 41% de mercado de la nube pública, Microsoft tenía el 20% y Google tenía el 6%, según Gartner.
Eso no significa que a Google le esté yendo mal. Los analistas esperan que su división en la nube genere 26 mil millones de dólares en ingresos este año, aproximadamente cuatro veces y media lo que ganó en 2018, el año anterior a que Kurian se convirtiera en director ejecutivo.
La operación no es rentable, pero Kurian ha reducido sus pérdidas y ha dicho que su enfoque sigue siendo el crecimiento en lugar de las ganancias. Google dijo el 1 de febrero que su unidad de nube generó 5,540 millones de dólares en ventas en el cuarto trimestre, superando las estimaciones de los analistas.
La fuerza en laboral de Google Cloud ha crecido a 40,000 personas, de 25,000 cuando él asumió el cargo; su lista de clientes multinacionales incluye a Goldman Sachs, HBS y Twitter.
La centralización extrema de la red de centros de datos de Google es un gran desafío. La empresa diseñó su infraestructura para que las máquinas en partes remotas del mundo dependiera en gran medida de las más cercanas a casa. Este diseño facilitó que Google brindara la misma gama de servicios de millones de personas en todo el mundo. También le permitió mantener los datos al día y actualizar rápidamente el software.
Sin embargo, ese enfoque tiene dificultades, que llegaron al punto crítico en junio de 2019 en un incidente al que los gurús ahora se refieren como el ‘apocalipsis Maya’.
Los trabajadores del centro de datos de Google estaban realizando reparaciones físicas en algunas máquinas en Oregon; durante el proceso, un error en un programa de software llamado Maya, que cambia automáticamente las responsabilidades entre los servidores, apagó otro sistema, el Borg Masters, que actúa efectivamente como un control para toda la red.
Esto desencadenó un efecto dominó que colapsó los servicios en América del Norte y del Sur. Cuando los servidores fallaron, la capacidad de la red se redujo y se congestionó más, lo que provocó ralentizaciones para los espectadores de YouTube y retrasó los esfuerzos para volver a poner el sistema en línea.
Google Cloud emprendió una serie de iniciativas para aislar sus servidores entre sí cuando surgió la necesidad. La idea era dar a los clientes la opción de cortar temporalmente, o ‘arrancar’ las conexiones entre regiones para separar los datos y evitar que los problemas se propaguen.
Algunos clientes expresaron una profunda frustración y enojo, diciendo que habían perdido la fe en Google o que podrían considerar proveedores de nube alternativos, según los empleados. Es difícil evaluar qué tan serias son estas amenazas; cambiar los proveedores de la nube es una tarea importante, y los proveedores de la competencia también han sufrido sus propias interrupciones periódicas.
Dada la dificultad que enfrentan los forasteros para evaluar la confiabilidad relativa de las redes, no pueden estar seguros de que se encontrarán menos interrupciones en otros lugares.
Incluso si Kurian logra convertir a Google en la nube más confiable, manejar eso como una ventaja comercial puede ser tanto un desafío de marketing como tecnológico.