فلج شدن موقت امپراتوری کلود؛ قطعی سرتاسری هوش مصنوعی Anthropic سازمان‌های جهان را به کما برد!

بحران در زیرساخت‌های هوش مصنوعی! پلتفرم آنتروپیک (Anthropic) به دلیل مشکلات شدید زیرساختی، با اختلال گسترده روبرو شد و خدمات حیاتی آن شامل سایت کلود، ابزارهای برنامه‌نویسی و API برای چندساعت کاملاً قطع گردید.

خبرنگار:

بهراد یوسفی

۱. جزئیات بحران سایبری: کدام مدل‌ها و در چه زمانی آسیب دیدند؟

در ساعت ۱۵:۰۸ به وقت جهانی (UTC) در تاریخ ۵ ژوئن ۲۰۲۶، صفحه وضعیت رسمی شرکت آنتروپیک هشداری مبنی بر افزایش شدید نرخ خطا (Error Rates) در مدل‌های پیشرفته خود صادر کرد. این اختلال بزرگ، خدمات کلیدی از جمله وب‌سایت اصلی (claude.ai)، پنل متصل‌کننده برنامه‌نویسان (Claude API)، ابزار کدنویسی خودکار (Claude Code) و پلتفرم همکار سازمانی (Claude Cowork) را به طور کامل تحت تاثیر قرار داد.

تیم مهندسی آنتروپیک برای حل مشکل، فرآیند بازیابی و احیای مدل‌ها را به صورت مرحله به مرحله جلو برد که زمان‌بندی دقیق پدیدار شدن دوباره آن‌ها به شرح زیر است:

مدلOpus 4.6: بازیابی در ساعت ۱۵:۲۵ UTC
مدلSonnet 4.6: بازیابی در ساعت ۱۶:۲۳ UTC
مدلOpus 4.8: بازیابی در ساعت ۱۶:۵۹ UTC
مدلOpus 4.7: بازیابی در ساعت ۱۷:۱۲ UTC
مدلOpus 4.5: بازیابی در ساعت ۱۷:۲۹ UTC

فلج شدن موقت امپراتوری کلود؛ قطعی سرتاسری هوش مصنوعی Anthropic سازمان‌های جهان را به کما برد!
در نهایت، پایداری کامل شبکه در ساعت ۱۸:۲۷ UTC تایید شد و شرکت رسماً اعلام کرد که نرخ موفقیت سیستم به حالت عادی بازگشته است.

۲. ریشه خطا: اشباع زیرساخت یا نشت اطلاعات کارمندان؟

مهندسان آنتروپیک علت این حادثه را به «مشکلات و فشار شدید روی زیرساخت‌های سروری» نسبت داده‌اند و هرگونه فرضیه هک یا رخنه امنیتی مخرب را رد کرده‌اند. همچنین تا این لحظه، هیچ نشانه‌ای مبنی بر فاش شدن یا لو رفتن داده‌های حساس و چت‌های کاربران سازمانی گزارش نشده است.

با این حال، این قطعی بزرگ، نگرانی‌های امنیتی گذشته را دوباره زنده کرد. به عنوان مثال، در ژانویه ۲۰۲۶ یک آسیب‌پذیری در ابزار Claude Code کشف شده بود که به کدهای مخرب اجازه می‌داد کلیدهای دسترسی (API Keys) کاربران را سرقت کنند. این اولین باری نیست که کلود در سال ۲۰۲۶ از دسترس خارج می‌شود؛ این پلتفرم پیش از این در ماه‌های مارس و می نیز قطعی‌های جهانی گسترده‌ای را تجربه کرده بود که پایداری ۳۰ روزه آن را به ۹۹.۳ درصد کاهش داده است.

🔍 تحلیل اختصاصی امنیت و پدافند سایبری ۲۴ نیوز:

این حادثه، فرضیه کلیدی «نقطه کور در زنجیره تامین هوش مصنوعی» را اثبات می‌کند. امروزه بسیاری از سازمان‌ها، اتوماسیون‌های اداری، کدهای برنامه‌نویسی و سیستم‌های پاسخگویی به مشتریان خود را مستقیماً به API یک شرکت واحد (مانند آنتروپیک یا OpenAI) متصل کرده‌اند. وقتی این هسته مرکزی برای چند ساعت قطع می‌شود، عملاً بخش بزرگی از خدمات دیجیتال آن سازمان‌ها در سراسر جهان فلج خواهد شد.

از منظر امنیت، این حادثه یک زنگ خطر جدی است. با افزایش تقاضای جهانی برای استفاده از مدل‌های زبانی بزرگ (LLMs)، فشار روی دیتاسنترها به شدت بالا رفته است. خطر اصلی اینجاست که در زمان افت شدید کیفیت زیرساخت یا اختلال در توزیع ترافیک سرورها، مرز میان «کاهش سرعت سیستم» و «خطای تداخل داده‌ها» (Cross-Tenant Anomalies) بسیار باریک می‌شود؛ به این معنی که این پتانسیل وجود دارد که به دلیل قاطی شدن کانال‌های سرور، پاسخ هوش مصنوعی به یک کاربر، برای کاربر یا سازمان دیگری نمایش داده شود که این خود یک فاجعه نشت اطلاعات مخفی به شمار می‌رود. بنابراین، سازمان‌ها باید استراتژی دفاعی خود را از تک‌محوری خارج کنند.

🛡️ راهکارهای پدافندی ۲۴ نیوز برای مدیران شبکه و آی‌تی:

شرکت‌ها و تیم‌های فنی که از مدل‌های کلود در سیستم‌های زنده خود استفاده می‌کنند، باید فوراً پروتکل‌های امنیتی زیر را پیاده‌سازی کنند:

معماری مسیرهای جایگزین (Fallback Routing): سیستم‌های خود را طوری طراحی کنید که اگر API کلود قطع شد، درخواست‌ها به صورت خودکار و بدون نیاز به دخالت دست، به سمت مدل‌های رقیب (مثل GPT یا مدل‌های متن‌باز محلی) هدایت شوند تا خدمات سازمان متوقف نشود.
فرمول تأخیر و تکرار هوشمند (Exponential Backoff): در کدهای اتصال به هوش مصنوعی، مکانیزم تکرار هوشمند قرار دهید تا در صورت بروز خطای لحظه‌ای سرور، درخواست‌ها با فواصل زمانی افزایشی دوباره ارسال شوند و سیستم با قفل شدن مواجه نشود.
ابزارهای مانیتورینگ اختصاصی هوش مصنوعی: از ابزارهای نظارتی برای ردیابی حجم توکن‌های مصرفی و جهش‌های ناگهانی خطاهای منطقه‌ای استفاده کنید تا پیش از اعتراض کاربران، از قطعی سیستم باخبر شوید.