شرکت Anthropic روز دوشنبه از Opus 4.5، تازهترین نسخه مدل پرچمدار خود رونمایی کرد. این نسخه آخرین عضو از سری ۴.۵ محسوب میشود؛ پیش از این، مدلهای Sonnet 4.5 در شهریور و Haiku 4.5 در مهر منتشر شده بودند.
عملکرد پیشرفته در بنچمارکهای کلیدی
طبق انتظار، نسخه جدید Opus در مجموعهای از معیارهای عملکردی نتایج پیشرفته و همسطح بهترین مدلهای موجود ارائه میدهد؛ از جمله در بنچمارکهای کدنویسی (SWE-Bench و Terminal-bench)، استفاده از ابزارها (tau2-bench و MCP Atlas) و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond).
نکته مهم این است که Opus 4.5 نخستین مدلی است که در بخش SWE-Bench verified امتیازی بیش از ۸۰٪ کسب میکند؛ معیاری معتبر و شناختهشده در حوزه ارزیابی توانایی کدنویسی مدلهای زبانی.

تمرکز ویژه بر کار با رایانه و صفحات گسترده
Anthropic در معرفی این نسخه، تواناییهای مدل در تعامل با رایانه و مدیریت صفحات گسترده را برجسته کرده و همزمان چند محصول مکمل برای نمایش این قابلیتها منتشر کرده است. همراه با Opus 4.5، نسخههای توسعهیافتهی Claude for Chrome و Claude for Excel که پیشتر در مرحله پایلوت بودند، به شکل گستردهتر عرضه میشوند.
افزونه کروم برای کاربران Max و نسخه مخصوص اکسل برای کاربران Max، تیم و سازمانی قابل استفاده است.
بهبودهای حافظه و قابلیت «چت بیپایان»
Opus 4.5 با بهبودهای مهم در مدیریت حافظه برای پردازش متنهای بلند همراه است؛ بهبودهایی که نیازمند تغییرات اساسی در نحوه مدیریت حافظه مدل بودهاند.
دیان نا پن، مدیر محصول پژوهش در Anthropic، در گفتگو با TechCrunch توضیح میدهد:
«در Opus 4.5 روی کیفیت پردازش متن بلند کار کردیم، اما صرف داشتن یک پنجره متنی بزرگ کافی نیست. تشخیص اینکه کدام جزییات باید در حافظه باقی بمانند، به اندازه خود اندازه پنجره اهمیت دارد.»
این تغییرات امکان ارائه یک قابلیت قدیمی و بسیار درخواستی را فراهم کرده است:
قابلیت چت بیپایان برای کاربران پولی Claude. در این حالت، زمانی که مدل به انتهای پنجره متنی خود میرسد، بدون قطع مکالمه، حافظه خود را بهصورت فشرده بازتنظیم میکند، بدون اینکه کاربر متوجه این فرآیند شود.
بهینهسازی برای کاربردهای عاملی (Agentic)
بسیاری از ارتقاها با هدف تقویت سناریوهایی انجام شده که در آن Opus بهعنوان عامل اصلی عمل کرده و گروهی از زیرعاملهای مبتنی بر Haiku را هدایت میکند. مدیریت چنین وظایفی نیازمند حافظه کاری قوی است؛ جایی که بهبودهای جدید بهخوبی ارزش خود را نشان میدهند.
پن میگوید:
«در اینجا اصولی مانند حافظه بسیار مهم میشوند، زیرا Claude باید بتواند کدبیسها و اسناد بزرگ را بررسی کند و بداند چه زمانی لازم است به عقب برگردد و دوباره بخشی را بازبینی کند.»
رقابت شدید در عرصه مدلهای پیشرفته
Opus 4.5 با رقابت جدی از سوی مدلهای تازهمنتشرشده روبهرو خواهد شد؛ از جمله GPT 5.1 شرکت اوپنایآی که در ۲۱ آبان منتشر شد و Gemini 3 گوگل که در ۲۷ آبان معرفی شد.
به مطالعه ادامه دهید:
- بیت کوین در آستانه سقوط آزاد؛ با فرار سرمایهگذاران از داراییهای پرریسک!
- انقلاب در هواشناسی: مدل هوش مصنوعی «WeatherNext 2» گوگل با ۸ برابر سرعت بیشتر!
- بازگشت باشکوه؛ گلکسی A77 با چیپست ۱۰ هستهای در گیکبنچ رویت شد!
- شفافیت بیسابقه در X؛ قابلیت «درباره این حساب» کشور مبدأ و جزئیات پنهان پروفایلها را فاش میکند!