أصدرت Anthropic اليوم كلود سونيت 5، وهو نموذج جديد للذكاء الاصطناعي تقول الشركة إنه يقدم أداءً شبه رائد بأسعار متوسطة المستوى – وهي خطوة مصممة لمنح مطوري المؤسسات المهتمين بالتكلفة إمكانية الوصول إلى قدرات وكيلة قوية تمامًا كما يتجه مختبر الذكاء الاصطناعي ومقره سان فرانسيسكو نحو طرح عام أولي سيختبر ما إذا كانت تقييمات الذكاء الاصطناعي المذهلة في السوق الخاصة يمكن أن تنجو من التدقيق العام.
الإصدار الذي يصفه الأنثروبي بأنه "نموذج Sonnet الأكثر وكيلًا حتى الآن،" يجعل Sonnet 5 النموذج الافتراضي للمستخدمين في خطط Anthropic’s المجانية وPro، مع إتاحته أيضًا لعملاء Max وTeam وEnterprise. تم تحديد التسعير التمهيدي لواجهة برمجة التطبيقات (API) عند 2 دولار لكل مليون رمز إدخال و10 دولارات لكل مليون رمز إخراج حتى 31 أغسطس، وبعد ذلك يرتفع إلى 3 دولارات و15 دولارًا على التوالي – ولا يزال أقل بكثير من 5 دولارات للمدخلات و25 دولارًا لسعر المخرجات لـ Opus 4.8 من Anthropic.
المنطق الاستراتيجي واضح لا لبس فيه: تحاول شركة Anthropic إضفاء الطابع الديمقراطي على الوصول إلى القدرات التي لم يكن من الممكن توفيرها إلا لنماذجها الأكثر تكلفة حتى وقت قريب جدًا، مع بناء نوع من اعتماد المطورين على نطاق واسع والذي سيبدو جذابًا في ملف S-1.
تُظهر معايير Sonnet 5 أن نموذج الطبقة المتوسطة يقترب من Opus الرائد في Anthropic
تحقق Sonnet 5 مكاسب كبيرة مقارنة بسابقتها، Sonnet 4.6، عبر كل تقييم تم الكشف عنه بواسطة Anthropic. في SWE-bench Pro، وهو معيار ترميز وكيل، حصلت Sonnet 5 على 63.2% مقارنة بـ Sonnet 4.6 التي حصلت على 58.1% – وهي قفزة تجعلها على مسافة مذهلة من Opus 4.8 التي حصلت على 69.2%. في Terminal-Bench 2.1، وهو تقييم ترميز آخر، تضيق الفجوة أكثر: 80.4% لـ Sonnet 5 مقابل 67.0% لـ Sonnet 4.6 و82.7% لـ Opus 4.8.
في التفكير متعدد التخصصات، كما تم قياسه بواسطة الاختبار الأخير للإنسانية، حصلت Sonnet 5 على 43.2% بدون أدوات و57.4% باستخدام الأدوات – الرقم الأخير يتطابق بشكل أساسي مع Opus 4.8’s 57.9%. في مهام استخدام الكمبيوتر التي تم تقييمها من خلال OSWorld-Verified، يصل Sonnet 5 إلى 81.2%، ارتفاعًا من 78.5%. وفي اختبار الناتج المحلي الإجمالي (GDVval-AA v2)، وهو معيار العمل المعرفي، حصل على 1,618 نقطة – متجاوزًا 1,615 لـ Opus 4.8 و1,395 لـ Sonnet 4.6 بكثير.
يحكي النمط عبر هذه التقييمات قصة متسقة: لا تتقدم Sonnet 5 فقط عن سابقتها. إنه يقفز إلى مستوى أداء يتداخل بشكل كبير مع نموذج Anthropic الرئيسي، في حين أن التكلفة أقل بنسبة 60٪ تقريبًا لكل رمز مميز بالسعر القياسي وحتى أقل خلال الفترة التمهيدية.
يقول شركاء المؤسسات إن قدرات الذكاء الاصطناعي الخاصة بـ Sonnet 5 تنهي المهام التي تخلت عنها النماذج السابقة
إن التركيز على القدرات الوكيلة – القدرة على التخطيط، واستخدام أدوات مثل المتصفحات والمحطات الطرفية، وتنفيذ سير عمل متعدد الخطوات بشكل مستقل – يعكس المكان الذي تحول فيه مركز ثقل صناعة الذكاء الاصطناعي في عام 2026. لم تعد الشركات تطرح أسئلة على روبوتات الدردشة فحسب؛ إنهم ينشرون أنظمة الذكاء الاصطناعي التي يمكنها التنقل في بيئات برمجية معقدة، وتنفيذ مهام ترميز متعددة الخطوات، والعمل مع الحد الأدنى من الإشراف البشري.
رسم شركاء الوصول المبكر صورة لنموذج لا يبدأ المهام فحسب، بل ينهيها أيضًا. قال صوالح آصف، المؤسس المشارك لـ Cursor، محرر الأكواد المدعوم بالذكاء الاصطناعي والذي أصبح رائدًا في اعتماد أدوات المطورين: "مع Claude Sonnet 5، يظل الوكلاء وفقًا للخطة، ويتبعون اتفاقياتنا، ويرسلون تغييرات نظيفة متعددة الخطوات، كل ذلك بتكلفة فعالة." وصف دانييل شيبرد، أحد كبار المهندسين في Zapier، تسليم النموذج بمهمة أتمتة مكونة من جزأين – تحديث طبقات حساب Salesforce وإرسال إعلان الإطلاق – "تستخدم للمماطلة في منتصف الطريق" مع النماذج السابقة ولكن الآن يكتمل من البداية إلى النهاية.
هذه الشهادات مهمة لأنها تصف بالضبط نوع فجوة الموثوقية التي منعت العديد من المؤسسات من نقل الذكاء الاصطناعي الوكيل من البرامج التجريبية إلى عمليات نشر الإنتاج. النموذج الذي يقطع 80% من الطريق خلال مهمة معقدة قبل أن يؤدي المماطلة إلى خلق مشكلات أكثر مما يحلها؛ إن النظام الذي يكمل سير العمل الكامل بشكل موثوق يغير اقتصاديات الأتمتة. قدمت Anthropic أيضًا منحنيات أداء التكلفة التي توضح أنه يمكن للمطورين الآن ضبط مستويات الجهد عبر Sonnet 5 وOpus 4.8 للعثور على التوازن الأمثل للتكلفة والدقة لحالة الاستخدام المحددة الخاصة بهم – وهو تفصيل يعكس التطور المتزايد في كيفية استهلاك المؤسسات لخدمات الذكاء الاصطناعي.
يعمل الرمز المميز المحدث على تعزيز أداء Sonnet 5 ولكنه قد يؤدي بهدوء إلى رفع تكاليف بعض أعباء العمل
إحدى التفاصيل الفنية المدفونة في حواشي الإعلان تستحق الاهتمام: يستخدم Sonnet 5 أداة رمزية محدثة تغير كيفية معالجة النموذج للنص، على غرار التغيير الذي قدمته Anthropic مع Opus 4.7.
وتتمثل المقايضة في أن نفس الإدخال يمكن تعيينه لما يقرب من 1.0 إلى 1.35 مرة من الرموز المميزة اعتمادًا على نوع المحتوى. تقول Anthropic أن التسعير التمهيدي تم معايرته لإجراء عملية الانتقال "محايدة التكلفة تقريبًا،" لكن عملاء المؤسسات الذين يقومون بأحمال عمل كبيرة الحجم سيرغبون في قياس حالات الاستخدام المحددة الخاصة بهم بعناية قبل افتراض أن فواتيرهم لن تتغير.
تقول Anthropic أن Sonnet 5 أكثر أمانًا من سابقتها، لكن نماذجها الأكثر قدرة لا تزال تقود إلى المحاذاة
تكشف إفصاحات السلامة الخاصة بشركة Anthropic عن صورة دقيقة. تفيد الشركة أن Sonnet 5 يُظهر معدلات هلوسة وتملق أقل من Sonnet 4.6، وهو أفضل في رفض الطلبات الضارة، وأكثر مقاومة لهجمات الحقن السريعة في سياقات الوكيل. في التدقيق السلوكي الآلي الذي أجرته Anthropic – والذي يختبر مجموعة واسعة من السلوكيات المنحرفة بما في ذلك التعاون مع سوء الاستخدام والخداع – سجلت Sonnet 5 نقاطًا أقل (بمعنى أكثر أمانًا) بشكل عام من Sonnet 4.6.
ومع ذلك، السوناتة 5 أظهر "معدلات أعلى إلى حد ما من السلوك المنحرف" مقارنةً بـ Opus 4.8 الأكثر قدرة وAnthropic’s Claude Mythos Preview، وهو نموذج الشركة القوي ولكنه مقيد بشدة والذي يركز على الأمن السيبراني. في تقييم تطوير استغلال Firefox 147 الذي تم إنشاؤه بالتعاون مع Mozilla، لم يتمكن أي من نموذجي Sonnet من تطوير استغلال فعال – سجل كلاهما 0.0% – على الرغم من أن Sonnet 5 أظهر معدل نجاح جزئي أعلى قليلاً (13.2%) من Sonnet 4.6 (8.8%). يظل كلاهما أقل بكثير من Opus 4.8 (68.8% من مآثر العمل) وMythos 5 (88.4%).
وبسبب هذه المكاسب المتزايدة في القدرات السيبرانية المجاورة، أطلقت Anthropic Sonnet 5 مع تمكين الضمانات السيبرانية افتراضيًا – أنظمة في الوقت الفعلي تكتشف وتمنع الاستخدام الخطير للأمن السيبراني. تعكس الضمانات تلك الموجودة في Opus 4.7 و4.8 ولكنها أقل تقييدًا من تلك المطبقة على Fable 5، وهو أحدث نموذج من فئة Mythos الذي ذكرته بلومبرج في 10 يونيو. "تم منعه من الرد على الاستفسارات المتعلقة بالأمن السيبراني والبيولوجيا." تحصل المنظمات المسجلة في برنامج التحقق الإلكتروني من Anthropic تلقائيًا على نفس الوصول إلى Sonnet 5 دون الحاجة إلى إعادة تقديم الطلب.
من 14 مليار دولار إلى 47 مليار دولار من الإيرادات: وصول Sonnet 5 مع تبلور قصة الاكتتاب العام الأولي لشركة Anthropic
يصل إطلاق Sonnet 5 إلى ما قد يكون اللحظة الأكثر أهمية في تاريخ الأنثروبيك القصير. قدمت الشركة بشكل سري نشرة الاكتتاب العام الأولي إلى هيئة الأوراق المالية والبورصات في أوائل يونيو، لتؤسس ما وصفته CNBC بأنه "الطرح العام الأكثر تمحيصًا في تاريخ التكنولوجيا."
لقد كان المسار المالي غير عادي. في فبراير، جمعت شركة Anthropic مبلغ 30 مليار دولار بتقييم قدره 380 مليار دولار، حيث أعلنت الشركة عن إيرادات سنوية بقيمة 14 مليار دولار. "نمت أكثر من عشرة أضعاف في كل سنة من السنوات الثلاث الماضية،" كما ذكرت صحيفة الغارديان.
بحلول أواخر شهر مايو، كانت شركة Anthropic قد أغلقت جولة السلسلة H بقيمة 65 مليار دولار بتقييم ما بعد النقد بقيمة 965 مليار دولار – بقيادة مشتركة من Altimeter Capital وSequoia Capital وآخرين – مع معدل تشغيل إيرادات تجاوز 47 مليار دولار. وقال هاريسون رولفس، المحلل في PitchBook، لشبكة CNBC إن الرقم الذي سيفعله "إما التحقق من صحة أو انهيار السرد بأكمله الذي كانت الأسواق الخاصة تقوم بتسعيره لمدة ثلاث سنوات" لن يكون التقييم أو الإيرادات، ولكن هامش الربح الإجمالي – وهو رقم لم يره أي مراقب خارجي حتى الآن.
في هذا السياق، تخدم Sonnet 5 غرضًا مزدوجًا. بالنسبة للمطورين، فهو يوفر تحسينات حقيقية في القدرات وبأسعار تنافسية. بالنسبة لسرد الاكتتاب العام الأولي لشركة Anthropic، فهو يوضح أن الشركة يمكنها تقديم منتج مقنع بطبقة سعرية يمكن أن تدفع هذا النوع من الاعتماد الواسع النطاق لمكافآت وول ستريت – إيرادات واجهة برمجة التطبيقات (API) كبيرة الحجم والمتكررة من آلاف عملاء المؤسسات.
الصفقات الحكومية والمنافسة المتزايدة تحدد السوق الذي تدخله Sonnet 5
يتماشى التوقيت أيضًا مع دفعة Anthropic القوية نحو العقود المؤسسية. بالأمس فقط، أعلن حاكم كاليفورنيا جافين نيوسوم عن شراكة هي الأولى من نوعها توفر كلود لجميع وكالات الولاية بخصم 50%، مع تدريب مجاني للقوى العاملة.
ووصفت كيت جنسن، رئيسة منظمة الأنثروبيك في الأمريكتين، الأمر بأنه جهد من أجل "اجعل كلود يعمل لصالح الأشخاص الذين يحافظون على استمرارية هذه الولاية." تمثل الصفقة – التي تمتد إلى مدن ومقاطعات كاليفورنيا – بالضبط نوع التبني الدائم والمتكرر الذي يمكن أن يرسخ الإيرادات إلى ما هو أبعد من مجتمع المطورين.
لكن إطلاق سراح أنثروبيك يقع في مجال مزدحم بشكل متزايد. تسعى OpenAI، التي جمعت جولة بقيمة 122 مليار دولار في مارس بتقييم 852 مليار دولار، إلى طرح عام أولي خاص بها. قامت شركة SpaceX التابعة لشركة Elon Musk، والتي اندمجت مع xAI، بتسعير طرحها العام الأولي بسعر 135 دولارًا للسهم الواحد بقيمة 1.77 تريليون دولار. إن جوجل، وميتا، وموجة متنامية من المنافسين الممولين بشكل جيد – بما في ذلك شركات الذكاء الاصطناعي الآسيوية الناشئة التي تعمل، كما ذكرت صحيفة وول ستريت جورنال، على تطوير قدرات الأمن السيبراني الشبيهة بالأساطير – جميعها تتنافس على نفس سوق المؤسسات.
وقال جيل لوريا، رئيس قسم أبحاث التكنولوجيا في DA Davidson، لـ CNBC إنه في حين أن Anthropic "يبدو أن لديها زمام المبادرة" في نماذج الذكاء الاصطناعي الحدودية، "الكثير من استخدامها الحالي مخصص للتجارب والتجريب وقد لا يستمر ذلك." تقع هذه الملاحظة في قلب التحدي الذي يواجه كل مختبرات الذكاء الاصطناعي الرائدة: تحويل الاستخدام التجريبي للمطورين إلى إيرادات دائمة على مستوى الإنتاج.
الاختبار الحقيقي لـ Sonnet 5 ليس المعايير – بل ما إذا كان الذكاء الاصطناعي الأرخص يمكنه الحفاظ على قصة تبلغ قيمتها تريليون دولار
يعد تحديد موقع Sonnet 5 – الذي يقدم أداءً قريبًا من Opus بأسعار Sonnet – بمثابة مسرحية مباشرة لهذا التحويل. قد يجد عملاء المؤسسات الذين يجربون نماذج باهظة الثمن من فئة Opus أن Sonnet 5 توفر جودة كافية لأحمال عمل الإنتاج بسعر يمكن أن توافق عليه فرق التمويل على نطاق واسع. وإذا نجح الأمر، فقد يؤدي إلى تسريع التحول من التجريب إلى النشر، وهو الأمر الذي تحتاج إليه كل شركة في مجال الذكاء الاصطناعي لتبرير تقييمها.
هناك ثلاثة أشياء ستحدد ما إذا كانت Sonnet 5 ذات أهمية تتجاوز المخططات المعيارية الأولية. موثوقية الوكلاء في العالم الحقيقي هي الأولى: تقيس المعايير القدرة، ولكن عمليات نشر الإنتاج تقيس الاتساق، وسوف يأتي الاختبار الحقيقي عندما يدفع الآلاف من المطورين النموذج من خلال سير عمل فوضوي وغير متوقع على نطاق واسع.
اقتصاديات الرمز المميز هي الثانية: يمكن أن يؤدي توسيع الرمز المميز المحدث من 1.0 إلى 1.35 مرة إلى تآكل ميزة التسعير لأعباء عمل معينة، ويجب على عملاء المؤسسات إجراء تحليلات التكلفة الخاصة بهم بدلاً من الاعتماد على الأسعار الرئيسية لكل رمز مميز. والثالث هو رواية الاكتتاب العام الأولي نفسها: عندما تصبح شركة Anthropic’s S-1 عامة في نهاية المطاف، سيدقق المستثمرون فيما إذا كانت فئة Sonnet – الأرخص ولكن ذات الحجم الكبير – أو فئة Opus – باهظة الثمن ولكن ذات هامش مرتفع – تقود الجزء الأكبر من الإيرادات، والأهم من ذلك، إجمالي الربح.
كما قال رولفس من PitchBook لـ CNBC، نافذة الاكتتاب العام لعام 2026 "إما أن تصبح دورة الاكتتاب العام الأكثر أهمية منذ عصر الدوت كوم أو الدرس الأكثر تكلفة في السرد مقابل الأساسيات الذي تعلمته الأسواق العامة على الإطلاق."
تراهن شركة أنثروبيك على أن النموذج الجيد بما يكفي لمنافسة منتجها الرائد والرخيص بما يكفي لتشغيله على نطاق واسع هو المنتج الذي يسد الفجوة بين هاتين النتيجتين. وسوف تقرر الأسواق العامة قريباً ما إذا كانت توافق على ذلك.
