Una falla global en la nube de Amazon genera problemas a cientos de aplicaciones de empresas como Snapchat, Zoom y varios bancos

Pie de foto, Amazon informó que había solucionado el problema, que se produjo en Estados Unidos.

Muchos de los sitios web y aplicaciones más grandes del mundo han experimentado problemas este lunes debido a una interrupción que afectó a Amazon Web Services.

La interrupción intermitente del servicio afectó a importantes redes sociales como Snapchat y Reddit, plataformas como Duolingo y Zoom, bancos como Lloyds y Halifax, juegos como Roblox y Fortnite, y servicios de transferencia de dinero.

Amazon Web Services, la división de computación en la nube de Amazon que provee la infraestructura de millones de sitios web y aplicaciones, afirmó que aún persisten «errores significativos» de recuperación en algunos servicios, pero aseguró que el problema subyacente se solucionó.

Pese a los avances en la resolución del problema, seguirán surgiendo inconvenientes mientras todos los procesos retoman su velocidad normal, agregó.

Las demoras en la reanudación de los servicios, señaló la empresa, están relacionadas con la gran cantidad de solicitudes realizadas por los afectados que ahora deben ser procesadas.

Para entender mejor este proceso, imagina a muchas personas intentando enviar mensajes y que, de repente, se envían todos a la vez. Eso provoca un retraso mientras el sistema los procesa todos.

Amazon también informó que hay un problema con el lanzamiento de lo que denomina «nuevas instancias EC2». Se trata de computadoras virtuales alojadas en los servidores de la empresa tecnológica, con su propio espacio de disco duro y sistemas operativos.

Previamente, Downdetector —la plataforma que monitorea interrupciones y que es propiedad de Ookla— informó haber recibido más de 6,5 millones de denuncias a nivel mundial, que han afectado los servicios de más de 1000 empresas.

El problema comenzó en Estados Unidos, en el corazón de las operaciones de computación en la nube de Amazon, en Virginia del Norte.

En las últimas horas, los usuarios estadounidenses están reportando problemas con diversos sitios web, así como dificultades para enviar y recibir pagos en la plataforma Venmo.

Coinbase, la mayor plataforma de intercambio de criptomonedas de EE. UU., también ha experimentado problemas con sus servicios, así como la aplicación de inversiones Robinhood

Varios medios de comunicación también se vieron afectados por la interrupción, entre ellos el Wall Street Journal y el New York Times.

Amazon Web Services es un gigante estadounidense con una amplia presencia global, que se ha posicionado como la columna vertebral de internet.

Proporciona herramientas y computadoras que permiten el funcionamiento de aproximadamente un tercio de internet, ofrece espacio de almacenamiento y gestión de bases de datos, evita que las empresas tengan que mantener sus propias y costosas configuraciones y, además, conecta el tráfico a esas plataformas.

Si bien la interrupción parece estar en vías de resolverse, los expertos afirman que su escala e impacto han puesto de relieve el riesgo de que muchas empresas dependan en gran medida de un único proveedor dominante para su infraestructura vital.

Una hipótesis

«Desconocemos los detalles de lo que ha causado la caída de varios servicios cruciales de Amazon Web Services, dice Liv McMahon, reportera de tecnología de la BBC. «Y es posible que no lo conozcamos durante un tiempo».

Sin embargo, Amazon indicó en una de sus actualizaciones sobre la situación que el problema «parece estar relacionado con la resolución DNS del punto final de la API de DynamoDB en US-ESTE-1».

Pie de foto, El banco Lloyds experimentó dificultades como lo muestra esta foto de una pantalla que decía: «Lo sentimos, no podemos procesar su solicitud en este momento».

El DNS, que significa Sistema de Nombres de Dominio (DNS, por sus siglas en inglés: Domain Name System), a menudo se compara con una guía telefónica de internet.

McMahon explica que ese sistema convierte eficazmente los nombres de los sitios web que usan los usuarios en equivalentes numéricos de direcciones IP que las computadoras pueden leer y comprender.

Este proceso sustenta básicamente la forma en que usamos internet, y las interrupciones pueden impedir que los navegadores web encuentren el contenido que buscan.

Pero las interrupciones no son algo nuevo.

«En los últimos cinco años se han producido varias interrupciones masivas del servicio de internet, donde los problemas con una sola empresa han tenido enormes repercusiones», señala Joe Tidy, periodista de tecnología de la BBC.

«La mayoría de las veces, estos problemas se resuelven en cuestión de horas, mientras los ingenieros se esfuerzan por revertir errores o solucionar problemas sobre la marcha».

El reportero explica que los expertos llevan mucho tiempo señalando la creciente dependencia de un pequeño número de gigantes de internet como un factor, «ya que se ponen más huevos en menos canastas: cuando una gran empresa tiene un fallo, gran parte de la vida moderna y los negocios se paralizan».

Otras interrupciones

Entre las interrupciones de años recientes están:

  • Julio de 2024: Un segmento de un código sospechoso en el software de ciberseguridad CrowdStrike se instaló automáticamente en los sistemas informáticos, provocando su fallo y la aparición de un mensaje de error. Unas 8,5 millones de computadoras quedaron temporalmente sin poder utilizarse, dejando inactivos a muchos servicios de internet.
  • Octubre de 2021: Un «error de configuración» provocó la caída de Facebook, Instagram y WhatsApp durante casi seis horas. Otros sitios, incluido X, también sufrieron interrupciones debido al aumento de nuevas visitas a sus aplicaciones.
  • Junio de 2021: Amazon, Reddit, Twitch, GitHub, Shopify, Spotify y varios sitios de noticias estuvieron inactivos durante aproximadamente una hora después de que un bug, previamente desconocido, fuese accidentalmente activado por un cliente en el servicio de computación en la nube del proveedor Fastly.
  • Diciembre de 2020: Gmail, YouTube, Google Drive y otros servicios de Google se vieron interrumpidos simultáneamente durante unos 90 minutos después de que la compañía informara de «un problema de cuota de almacenamiento interno».

Nota tomada de: BBC News