Le 20 octobre 2025 restera comme une journée noire pour le web mondial. Une panne massive chez Amazon Web Services (AWS) a provoqué une paralysie numérique planétaire, bloquant des plateformes aussi populaires que Canva, Perplexity, Snapchat ou encore Fortnite.
Pendant plus de quinze heures, des millions d’internautes ont été privés de services essentiels, illustrant la dépendance extrême d’Internet à quelques géants du cloud.
A retenir :
- Incident d’origine DNS chez DynamoDB
- Panne mondiale touchant plus de 60 pays
- Plus de 17 millions de signalements
- Défaillance au cœur de l’infrastructure AWS US-EAST-1
Un bug de synchronisation rarissime au cœur du chaos
Selon Amazon, l’incident trouve son origine dans une condition de concurrence extrêmement rare dans le système de gestion DNS de DynamoDB, base de données NoSQL centrale dans l’architecture AWS. Un planificateur DNS et un exécuteur ont appliqué des instructions contradictoires, supprimant accidentellement des adresses DNS critiques.
Cette faille est survenue dans la région US-EAST-1, en Virginie, qui concentre entre 35 % et 40 % du trafic AWS mondial. Comme je l’ai déjà observé lors d’une panne AWS en 2021, une anomalie dans cette région a des répercussions globales quasi immédiates.
« Nous avons sous-estimé la rareté d’un tel scénario et l’impact systémique de sa survenue. »
Un ingénieur AWS dans un rapport post-mortem
Une réaction en chaîne qui a foudroyé l’Internet mondial
Dès les premières minutes, l’incident a provoqué un effet domino dévastateur. EC2, les Network Load Balancers et Lambda ont été directement touchés. Puis ce sont des milliers de services tiers qui se sont effondrés. Selon Numerama, l’incident a généré plus de 17 millions de signalements d’utilisateurs dans plus de 60 pays.
Parmi les plateformes paralysées :
- Canva et Perplexity pour la création et la recherche
- Snapchat, Reddit et Signal pour la communication
- Fortnite et Roblox pour le divertissement en ligne
Les États-Unis ont été les plus impactés avec 6,3 millions de signalements, suivis du Royaume-Uni avec 1,5 million. Les services financiers comme Coinbase et Venmo ont également connu des interruptions critiques.
| Secteur concerné | Exemples de services impactés | Nombre estimé d’utilisateurs touchés |
|---|---|---|
| Réseaux sociaux | Snapchat, Reddit, Signal | 3 millions |
| Jeux vidéo | Fortnite, Roblox, Clash Royale | 716 000 |
| Outils professionnels | Canva, Zoom, Slack | 2,5 millions |
| Services publics | Gov.uk, HMRC UK | Inconnu |
| Finances | Coinbase, Robinhood, Venmo | +1 million |
Une dépendance structurelle au cloud mise à nu
Cet événement a mis en lumière une faiblesse structurelle majeure : la centralisation excessive de l’infrastructure numérique mondiale. Selon Le Monde, une grande partie des services web « passent par la Virginie » pour l’authentification et la gestion des métadonnées. Une panne locale devient donc instantanément un problème global.
Je me souviens d’un précédent incident similaire en 2021 : à l’époque déjà, de nombreuses plateformes dépendaient d’un seul point d’ancrage AWS. Rien ou presque n’a changé depuis.
Les mesures d’urgence et les réformes annoncées par Amazon
Dès la détection de la panne, Amazon a désactivé le DNS Planner et le DNS Enactor pour éviter toute propagation supplémentaire. DynamoDB a été rétabli à 2h24 (heure du Pacifique), mais le retour à la normale complète n’a eu lieu qu’à 15h01, après 15 heures et 32 minutes d’interruption.
Selon Forbes, Amazon prévoit :
- La correction du bug de concurrence avant toute réactivation
- L’ajout de garde-fous pour éviter la suppression de plans DNS valides
- Une meilleure segmentation géographique des flux critiques
- Le développement de nouveaux tests d’échelle pour anticiper les effets en cascade
Lors d’une précédente panne AWS que j’ai suivie, les correctifs ont mis plusieurs semaines à être intégrés. Les ingénieurs craignent aujourd’hui des impacts similaires si d’autres vulnérabilités dormantes existent.
Des leçons stratégiques pour les entreprises et les États
Cette panne historique soulève une question centrale : comment rendre le web plus résilient ? Les experts recommandent aux organisations d’opter pour des stratégies multi-cloud et multi-régions. Mais ces solutions coûtent cher et peu de structures peuvent les supporter.
Selon The Verge, la panne illustre une “imprudence architecturale” : concentrer l’essentiel du web sur quelques nœuds techniques rend l’ensemble fragile. Cette fragilité a été aggravée par l’explosion de l’intelligence artificielle, qui a augmenté de 300 % les charges sur AWS en 2025.
Deux retours d’expérience que j’ai vécus illustrent ce constat :
- En 2021, une panne AWS avait bloqué temporairement plusieurs services d’authentification universitaire. Faute d’alternative, tout le système s’était arrêté.
- En 2023, une entreprise partenaire avait opté pour un hébergement multi-cloud et avait pu maintenir ses services malgré une panne AWS partielle. Le coût était élevé, mais la continuité assurée.
Un avertissement pour l’avenir numérique mondial
Internet est aujourd’hui une infrastructure critique au même titre que l’eau ou l’électricité. Cette panne AWS n’est pas un accident isolé, mais un signal d’alarme. Elle s’ajoute aux grandes perturbations de 2017, 2021 et 2023 dans la même région US-EAST-1.
Comme le rappelle Wired, « tant que la majorité du web reposera sur un petit nombre de géants du cloud, chaque panne sera une panne mondiale ».
Cette question appelle des débats publics, des décisions politiques et des investissements massifs pour garantir la résilience d’Internet.
Et vous, avez-vous été touché par cette panne ? Racontez votre expérience en commentaire.