lunes, 16 de mayo de 2011

Tormentas en la nube: lecciones prácticas sobre fiabilidad para el futuro del cloud computing

Los pasados Jueves y Viernes, 12 y 13 de Mayo respectivamente, pude vivir de primera mano la crisis de blogger. Una parada prevista de una hora por motivos de mantenimiento se convirtió en una indisponibilidad de las funcionalidades de edición durante bastante más de 24 horas unida a una pérdida, más tarde recuperada, eso sí, de las entradas introducidas con posterioridad al Miércoles 11.

Buscando un poco en Internet, encuentro otro incidente reciente que estaba buscando. El pasado 21 de Abril, la plataforma de Cloud Computing de Amazon, en concreto los sistemas de almacenamiento (el denominado Elastic Block Storage) tuvo problemas afectando a los servicios  Amazon EC2 y Amazon RDS y provocando, como efecto final, que muchas webs estuviesen caídas durante más de 24 horas.

En ambos casos, más de 24 horas fuera de servicio. Y no hablamos de unos actores cualquiera, sino de dos de los grandes protagonistas de la revolución de Internet y del emergente cloud computing: Google y Amazon.

Quizá ambos problemas muestren alguna debilidad del cloud computing actual o, al menos, nos pongan en guardia contra algunos de los peligros de un modelo en la nube llevado a sus extremos.

Si el cloud computing ha de cumplir su promesa, si se pretende que, como visionó ya hace años Nicholas Carr, el suministro de servicios de computación pueda alcanzar un modelo de auténtico servicio, si se pretende comoditizar la provisión de servicios de TI, éstos deben dar un salto cualitativo en lo que a fiabilidad se refiere. Y no sólo por motivos objetivos (cumplimiento de los niveles de servicio necesarios y comprometidos) sino también por el negativo impacto psicológico que una falta de fiabilidad, incluso si es puntual, pueda tener en la adopción de modelos de computación en la nube.

Bien es cierto que los dos problemas que mencionamos más arriba se han producido en servicios gratuitos, y en ese sentido no pueda quizá exigirse el mismo nivel de servicio que en situaciones de contrato. Pero dada la estrategia tanto de Google como de Amazon y la visibilidad que los servicios afectados les proporcionan, no parece que el resultado hubiese sido muy diferente en el caso de un servicio de pago dirigido, por ejemplo, a corporaciones.

Una segunda derivada, una segunda conclusión que podemos obtener de los hechos acaecidos en los pasados días y semanas, quizá menos obvia que la relativa a la fiabilidad, es la necesidad de que exista competencia. Si un actor como por ejemplo Google consigue copar de forma casi monopolística un segmento de la actividad del cloud computing ¿Qué puede suceder en caso de que esa empresa entre en problemas, ya sea de tipo técnico, financiero o cualquier otro? ¿Podemos confiar un servicio que se vuelva crítico, casi una 'utility' de la información, a una sola empresa? La prudencia parece aconsejar que no sea así.

Pero tampoco es necesario ser catastrofista. El cloud computing todavía se encuentra en su infancia y, en general, los servicios de la nube, incluyendo los servicios objeto de los problemas comentados, parecen razonablemente fiables. Sin embargo, si el cloud computing ha de ser el modelo de computación de los próximos años, quizá décadas, no debemos olvidar las lecciones que sobre fiabilidad y competencia nos proporcionan las recientes caídas de Blogger y la plataforma cloud de Amazon.