آمازون اعلام کرد باگ اتوماسیون باعث قطعی گسترده AWS شد
آمازون گزارش مفصلی درباره قطعی ۲۰ اکتبر منتشر کرد که باعث از کار افتادن وبسایتها، سرویسها، اپها و بازیهای متعدد شد. این مشکل از باگی در نرمافزار اتوماسیون DynamoDB شروع شد.
قطعی گسترده AWS ناشی از باگ اتوماسیون
شرکت آمازون گزارش کامل خود را درباره قطعی بزرگ سرویس AWS در تاریخ ۲۰ اکتبر منتشر کرده است. این حادثه که باعث اختلال در عملکرد وبسایتها، سرویسها، اپلیکیشنها و بازیهای متعدد شد، از یک باگ در نرمافزار اتوماسیون DynamoDB آغاز گشت. DynamoDB که محل ذخیرهسازی دادههای مشتریان AWS است، مسئول مدیریت صدها هزار رکورد DNS میباشد و قرار بود به صورت خودکار مشکلات را برطرف کند.
- باگ در سیستم مدیریت DNS منجر به ایجاد رکورد خالی برای دیتاسنترهای ویرجینیای شمالی شد
- سیستم اتوماسیون در ترمیم خودکار مشکل شکست خورد و نیاز به دخالت دستی داشت
- تمام سیستمهای وابسته به DynamoDB با اختلال DNS مواجه شدند
- خدمات ابری آمازون و مشتریان آن تحت تأثیر قرار گرفتند
- احساس میشد نیمی از اینترنت از کار افتاده است
"ما از تأثیر این رویداد بر مشتریانمان عذرخواهی میکنیم. میدانیم خدمات ما چقدر برای مشتریان، برنامههایشان و کسبوکارهایشان حیاتی است."
"ما همه تلاش خود را خواهیم کرد تا از این رویداد یاد بگیریم و دسترسی سرویسهایمان را بیشتر بهبود بخشیم."
این قطعی بر شرکتهای بزرگی مانند بانک آمریکا، اسنپچت، ردیت، اپل میوزیک، دیزنی پلاس، پلیاستیشن و حتی تختهای هوشمند Eight Sleep تأثیر گذاشت. برخی سرویسها کند شده و برخی کاملاً غیرقابل دسترس بودند.
