Anthropic نسخه Opus 4.5 را با یکپارچه‌سازی‌های جدید کروم و اکسل منتشر کرد!

سعید میرزاپور

7 ماه پیش

شرکت Anthropic روز دوشنبه از Opus 4.5، تازه‌ترین نسخه مدل پرچم‌دار خود رونمایی کرد. این نسخه آخرین عضو از سری ۴.۵ محسوب می‌شود؛ پیش از این، مدل‌های Sonnet 4.5 در شهریور و Haiku 4.5 در مهر منتشر شده بودند.

عملکرد پیشرفته در بنچمارک‌های کلیدی

طبق انتظار، نسخه جدید Opus در مجموعه‌ای از معیارهای عملکردی نتایج پیشرفته و هم‌سطح بهترین مدل‌های موجود ارائه می‌دهد؛ از جمله در بنچمارک‌های کدنویسی (SWE-Bench و Terminal-bench)، استفاده از ابزارها (tau2-bench و MCP Atlas) و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond).

نکته مهم این است که Opus 4.5 نخستین مدلی است که در بخش SWE-Bench verified امتیازی بیش از ۸۰٪ کسب می‌کند؛ معیاری معتبر و شناخته‌شده در حوزه ارزیابی توانایی کدنویسی مدل‌های زبانی.

هوش مصنوعی Anthropic

تمرکز ویژه بر کار با رایانه و صفحات گسترده

Anthropic در معرفی این نسخه، توانایی‌های مدل در تعامل با رایانه و مدیریت صفحات گسترده را برجسته کرده و هم‌زمان چند محصول مکمل برای نمایش این قابلیت‌ها منتشر کرده است. همراه با Opus 4.5، نسخه‌های توسعه‌یافته‌ی Claude for Chrome و Claude for Excel که پیش‌تر در مرحله پایلوت بودند، به شکل گسترده‌تر عرضه می‌شوند.
افزونه کروم برای کاربران Max و نسخه مخصوص اکسل برای کاربران Max، تیم و سازمانی قابل استفاده است.

بهبودهای حافظه و قابلیت «چت بی‌پایان»

Opus 4.5 با بهبودهای مهم در مدیریت حافظه برای پردازش متن‌های بلند همراه است؛ بهبودهایی که نیازمند تغییرات اساسی در نحوه مدیریت حافظه مدل بوده‌اند.

دیان نا پن، مدیر محصول پژوهش در Anthropic، در گفتگو با TechCrunch توضیح می‌دهد:
«در Opus 4.5 روی کیفیت پردازش متن بلند کار کردیم، اما صرف داشتن یک پنجره متنی بزرگ کافی نیست. تشخیص اینکه کدام جزییات باید در حافظه باقی بمانند، به اندازه خود اندازه‌ پنجره اهمیت دارد.»

این تغییرات امکان ارائه یک قابلیت قدیمی و بسیار درخواستی را فراهم کرده است:
قابلیت چت بی‌پایان برای کاربران پولی Claude. در این حالت، زمانی که مدل به انتهای پنجره متنی خود می‌رسد، بدون قطع مکالمه، حافظه خود را به‌صورت فشرده بازتنظیم می‌کند، بدون اینکه کاربر متوجه این فرآیند شود.

بهینه‌سازی برای کاربردهای عاملی (Agentic)

بسیاری از ارتقاها با هدف تقویت سناریوهایی انجام شده که در آن Opus به‌عنوان عامل اصلی عمل کرده و گروهی از زیرعامل‌های مبتنی بر Haiku را هدایت می‌کند. مدیریت چنین وظایفی نیازمند حافظه کاری قوی است؛ جایی که بهبودهای جدید به‌خوبی ارزش خود را نشان می‌دهند.

پن می‌گوید:
«در اینجا اصولی مانند حافظه بسیار مهم می‌شوند، زیرا Claude باید بتواند کدبیس‌ها و اسناد بزرگ را بررسی کند و بداند چه زمانی لازم است به عقب برگردد و دوباره بخشی را بازبینی کند.»

رقابت شدید در عرصه مدل‌های پیشرفته

Opus 4.5 با رقابت جدی از سوی مدل‌های تازه‌منتشرشده روبه‌رو خواهد شد؛ از جمله GPT 5.1 شرکت اوپن‌ای‌آی که در ۲۱ آبان منتشر شد و Gemini 3 گوگل که در ۲۷ آبان معرفی شد.

به مطالعه ادامه دهید: