فلج شدن موقت امپراتوری کلود؛ قطعی سرتاسری هوش مصنوعی Anthropic سازمانهای جهان را به کما برد!
بحران در زیرساختهای هوش مصنوعی! پلتفرم آنتروپیک (Anthropic) به دلیل مشکلات شدید زیرساختی، با اختلال گسترده روبرو شد و خدمات حیاتی آن شامل سایت کلود، ابزارهای برنامهنویسی و API برای چندساعت کاملاً قطع گردید.
۱. جزئیات بحران سایبری: کدام مدلها و در چه زمانی آسیب دیدند؟
در ساعت ۱۵:۰۸ به وقت جهانی (UTC) در تاریخ ۵ ژوئن ۲۰۲۶، صفحه وضعیت رسمی شرکت آنتروپیک هشداری مبنی بر افزایش شدید نرخ خطا (Error Rates) در مدلهای پیشرفته خود صادر کرد. این اختلال بزرگ، خدمات کلیدی از جمله وبسایت اصلی (claude.ai)، پنل متصلکننده برنامهنویسان (Claude API)، ابزار کدنویسی خودکار (Claude Code) و پلتفرم همکار سازمانی (Claude Cowork) را به طور کامل تحت تاثیر قرار داد.
تیم مهندسی آنتروپیک برای حل مشکل، فرآیند بازیابی و احیای مدلها را به صورت مرحله به مرحله جلو برد که زمانبندی دقیق پدیدار شدن دوباره آنها به شرح زیر است:
- مدلOpus 4.6: بازیابی در ساعت ۱۵:۲۵ UTC
- مدلSonnet 4.6: بازیابی در ساعت ۱۶:۲۳ UTC
- مدلOpus 4.8: بازیابی در ساعت ۱۶:۵۹ UTC
- مدلOpus 4.7: بازیابی در ساعت ۱۷:۱۲ UTC
- مدلOpus 4.5: بازیابی در ساعت ۱۷:۲۹ UTC

در نهایت، پایداری کامل شبکه در ساعت ۱۸:۲۷ UTC تایید شد و شرکت رسماً اعلام کرد که نرخ موفقیت سیستم به حالت عادی بازگشته است.
۲. ریشه خطا: اشباع زیرساخت یا نشت اطلاعات کارمندان؟
مهندسان آنتروپیک علت این حادثه را به «مشکلات و فشار شدید روی زیرساختهای سروری» نسبت دادهاند و هرگونه فرضیه هک یا رخنه امنیتی مخرب را رد کردهاند. همچنین تا این لحظه، هیچ نشانهای مبنی بر فاش شدن یا لو رفتن دادههای حساس و چتهای کاربران سازمانی گزارش نشده است.
با این حال، این قطعی بزرگ، نگرانیهای امنیتی گذشته را دوباره زنده کرد. به عنوان مثال، در ژانویه ۲۰۲۶ یک آسیبپذیری در ابزار Claude Code کشف شده بود که به کدهای مخرب اجازه میداد کلیدهای دسترسی (API Keys) کاربران را سرقت کنند. این اولین باری نیست که کلود در سال ۲۰۲۶ از دسترس خارج میشود؛ این پلتفرم پیش از این در ماههای مارس و می نیز قطعیهای جهانی گستردهای را تجربه کرده بود که پایداری ۳۰ روزه آن را به ۹۹.۳ درصد کاهش داده است.
🔍 تحلیل اختصاصی امنیت و پدافند سایبری ۲۴ نیوز:
این حادثه، فرضیه کلیدی «نقطه کور در زنجیره تامین هوش مصنوعی» را اثبات میکند. امروزه بسیاری از سازمانها، اتوماسیونهای اداری، کدهای برنامهنویسی و سیستمهای پاسخگویی به مشتریان خود را مستقیماً به API یک شرکت واحد (مانند آنتروپیک یا OpenAI) متصل کردهاند. وقتی این هسته مرکزی برای چند ساعت قطع میشود، عملاً بخش بزرگی از خدمات دیجیتال آن سازمانها در سراسر جهان فلج خواهد شد.
از منظر امنیت، این حادثه یک زنگ خطر جدی است. با افزایش تقاضای جهانی برای استفاده از مدلهای زبانی بزرگ (LLMs)، فشار روی دیتاسنترها به شدت بالا رفته است. خطر اصلی اینجاست که در زمان افت شدید کیفیت زیرساخت یا اختلال در توزیع ترافیک سرورها، مرز میان «کاهش سرعت سیستم» و «خطای تداخل دادهها» (Cross-Tenant Anomalies) بسیار باریک میشود؛ به این معنی که این پتانسیل وجود دارد که به دلیل قاطی شدن کانالهای سرور، پاسخ هوش مصنوعی به یک کاربر، برای کاربر یا سازمان دیگری نمایش داده شود که این خود یک فاجعه نشت اطلاعات مخفی به شمار میرود. بنابراین، سازمانها باید استراتژی دفاعی خود را از تکمحوری خارج کنند.
🛡️ راهکارهای پدافندی ۲۴ نیوز برای مدیران شبکه و آیتی:
شرکتها و تیمهای فنی که از مدلهای کلود در سیستمهای زنده خود استفاده میکنند، باید فوراً پروتکلهای امنیتی زیر را پیادهسازی کنند:
- معماری مسیرهای جایگزین (Fallback Routing): سیستمهای خود را طوری طراحی کنید که اگر API کلود قطع شد، درخواستها به صورت خودکار و بدون نیاز به دخالت دست، به سمت مدلهای رقیب (مثل GPT یا مدلهای متنباز محلی) هدایت شوند تا خدمات سازمان متوقف نشود.
- فرمول تأخیر و تکرار هوشمند (Exponential Backoff): در کدهای اتصال به هوش مصنوعی، مکانیزم تکرار هوشمند قرار دهید تا در صورت بروز خطای لحظهای سرور، درخواستها با فواصل زمانی افزایشی دوباره ارسال شوند و سیستم با قفل شدن مواجه نشود.
- ابزارهای مانیتورینگ اختصاصی هوش مصنوعی: از ابزارهای نظارتی برای ردیابی حجم توکنهای مصرفی و جهشهای ناگهانی خطاهای منطقهای استفاده کنید تا پیش از اعتراض کاربران، از قطعی سیستم باخبر شوید.
تحلیل و تنظیم فنی: تحریریه تخصصی امنیت زیرساخت ۲۴ نیوز (بهراد یوسفی)