Amazon, conocido principalmente como un gigante del comercio electrónico, se apoya en una infraestructura tecnológica robusta que constituye el núcleo de su operación: Amazon Web Services (AWS). Esta división ofrece un amplio rango de servicios, incluyendo almacenamiento, bases de datos, computación y redes, a través de más de 200 centros de datos en todo el mundo. Sin embargo, este lunes, AWS experimentó un fallo significativo que resultó en la degradación del acceso a varios servicios conectados en numerosas plataformas.
El problema, que se detectó alrededor de las nueve de la mañana (hora española), fue confirmado por la compañía y publicado en la web de seguimiento Downdetector. Amazon reportó un aumento en las tasas de error y la latencia para varios servicios AWS, particularmente en la región de la costa este de Estados Unidos. A pesar de que la empresa indicó que había trabajado en “múltiples alternativas paralelas” para restaurar el servicio, la recuperación fue gradual.
Desarrollo del incidente
Aproximadamente dos horas y media después de que se originara el fallo, el número de incidencias reportadas cayó casi a la mitad. Amazon comunicó, pasadas las 12:30 de la tarde, que el problema subyacente, relacionado con el sistema de nombres de dominio (DNS), se había mitigado por completo, aunque algunos servicios aún experimentaban dificultades en la ejecución de nuevas instancias.
“La mayoría de las operaciones del servicio de AWS se están realizando con normalidad ahora”, indicaron desde la empresa. Sin embargo, los usuarios aún debían esperar una recuperación completa, dado que algunos servicios, como CloudTrail y Lambda, continuaban lidiando con una acumulación de eventos pendientes.
Impacto en los servicios
El fallo afectó a una gran variedad de aplicaciones e plataformas. Servicios directamente vinculados a Amazon, como el asistente virtual Alexa, así como aplicaciones populares como Duolingo, Canva, Roblox y Coinbase, experimentaron problemas. También se reportaron interrupciones en plataformas de videojuegos como Fortnite y aplicaciones de mensajería como Snapchat. En el ámbito empresarial, compañías de transporte como Lyft y empresas de telecomunicaciones españolas como BBVA, ING Direct, Movistar y Orange resultaron afectadas.
Además, Live Nation, encargada de vender entradas a eventos, emitió un comunicado señalando problemas en la compra de pases para conciertos, indicando que la situación estaba bajo supervisión y se esperaba resolver pronto.
Incidentes en redes de pago
Si bien algunos medios vinculaban el fallo de AWS con problemas en la red de pagos Redsys, esta última aclaró que la situación fue resultado de una caída temporal en su infraestructura, no relacionada con el incidente de AWS. Redsys comentó que se trató de un problema aislado que limitó algunas operaciones de pago durante el periodo de interrupción.
Origen del apagón de AWS
La interrupción del servicio se ha atribuido a un problema en Amazon DynamoDB, una base de datos NoSQL que maneja grandes volúmenes de datos. Este servicio es crucial para más de un millón de clientes y procesa aproximadamente medio millón de solicitudes por segundo.
Estadísticas indican que más de 76,8 millones de sitios web utilizan los servicios de AWS, de los cuales cerca de 200,000 están en España, subrayando la magnitud de AWS en el ecosistema digital.
Reacciones al incidente
El fallo ha despertado reflexiones entre expertos sobre la vulnerabilidad del sistema. Rimesh Patel, especialista en informática, advirtió sobre la inestabilidad que puede surgir de depender de proveedores críticos de servicios. “La interrupción subraya la importancia de la resiliencia en la cadena de suministro”, menciona Patel.
Opiniones similares compartió Alan Woodward, profesor de la Universidad de Surrey, quien enfatizó que la interdependencia en la infraestructura digital puede traer consigo riesgos significativos. Patrick Burgess, del Instituto Chartered, destacó la necesidad de desarrollar resiliencia y diversidad en los sistemas digitales más utilizados.