A disputed episode around Anthropic’s Mythos has turned into a sharper warning about AI privilege, evaluation design, and how quickly a controlled test can become a policy problem.
قال مسؤول أمريكي إن نموذج Mythos التابع لشركة Anthropic حدّد ثغرات داخل أنظمة حكومية مصنفة خلال ساعات، في تذكير بأن السرعة في أبحاث الأمن يمكن أن تكون مهمة حتى عندما لا يكون الاستغلال مثبتا.
يوضح نزاع محدود حول الوصول إلى نظام ذكاء اصطناعي تجريبي كيف يمكن لحوكمة النماذج المتقدمة أن تتحول إلى مشكلة في ضوابط الأمن السيبراني، وليس مجرد مسألة سياسات.
الصدمة الحقيقية ليست مجرد اكتشاف الأخطاء على نطاق واسع، بل الفجوة المتزايدة بين العثور على ثغرة وإصلاحها بأمان قبل أن يفعل ذلك شخص آخر.
تشير قيود أمريكية مزعومة على الوصول إلى Fable 5 و Mythos 5 من Anthropic إلى أن تجاوزات الأمان بات يُنظر إليها الآن كخطر على نقل التكنولوجيا، وليس مجرد خلل في الذكاء الاصطناعي.
يبدو أن اسم Mythos من Anthropic يشير إلى مشكلة أوسع في حوكمة الذكاء الاصطناعي: كيف يمكن للمورّدين والمنظمين والمدافعين إبقاء الأنظمة عالية القدرة مفيدة من دون السماح للمخاطر بأن تسبق السيطرة.
وصول KISA إلى Mythos يلمّح إلى استخدام مضبوط وخاضع لضوابط أمنية للذكاء الاصطناعي المتقدم، حيث يكون اصطياد الثغرات - لا دردشة المستهلكين - هو الجائزة الحقيقية.
يُظهر التوسع الأوسع لبرنامج Mythos كيف أن اكتشاف الثغرات بمساعدة الذكاء الاصطناعي ينقل عنق الزجاجة من العثور على العيوب إلى فرزها والتحقق منها وإصلاحها بالسرعة الكافية.
يكشف المحاولة غير المحسومة من بنك إنجلترا للحصول على وصول إلى Mythos من Anthropic عن عنق زجاجة جديد في الأمن السيبراني: قد يوجد ذكاء اصطناعي قوي، لكن المدافعين المنظمين لا يحصلون دائما على استخدامه عندما يحتاجون إليه.
لقد صقل Mythos من Anthropic وProject Glasswing درسًا مزعجًا: لم يعد اكتشاف الثغرات مجرد وظيفة أمنية، لأن المعالجة أصبحت الآن تقع في الشفرة والخدمات وواجهات البرمجة والملكية.
تشير سلاسل الشيفرة وملامح الواجهة إلى أن Anthropic قد تكون بصدد إعداد توسع مضبوط لنموذج Mythos المقيد ليشمل تدفقات العمل الخاصة بالترميز والأمن، حيث لا تقل الصلاحيات أهمية عن قوة النموذج الخام.
يبرز إصدار مخطط له لنماذج فئة Mythos مشكلة مألوفة في الأمن السيبراني: كلما ازداد قوة محرك العثور على الشيفرة، أصبح من الأصعب إبقاء سطح إساءة الاستخدام تحت السيطرة.
تشير تقييم Cloudflare لنسخة Anthropic المسماة Mythos Preview إلى أن نموذجًا أمنيًا للذكاء الاصطناعي يمكن أن يتجاوز اكتشاف الثغرات ليصل إلى توليد استغلالات برهان المفهوم، على الأقل في سياق بحثي مضبوط.
تشير جولة حديثة من اختبارات أبريل إلى نقاط ضعف في منصة سطح المكتب من Apple، وتوضح كيف يمكن للذكاء الاصطناعي أن يحسن أبحاث الثغرات دون أن يعني ذلك وجود اختراق فعلي.
إن الدفع المبلّغ عنه نحو نموذج أمني موجّه إلى البنوك هو في الحقيقة اختبار لما إذا كان يمكن تحليل الشيفرة الحساسة بواسطة الذكاء الاصطناعي من دون التخلي عن السيطرة على مكان وجود تلك الشيفرة.
تشير منتدى عام-خاص مُخطط له إلى أن طوكيو تتعامل مع الذكاء الاصطناعي المتقدم ليس كتجربة بعيدة، بل كمتغير حي في الأمن السيبراني للنظام المالي.