رونمایی شیائومی از MiMo-V2.5؛ هوش مصنوعی با پردازش همزمان متن، تصویر، ویدیو و صدا

3 هفته پیش

خواندن این مطلب 2 دقیقه زمان میبرد

شرکت شیائومی تنها چند هفته پس از انتشار مدل MiMo-V2-Pro، از دو نسخه جدید از سامانه هوش مصنوعی خود با نام‌های MiMo-V2.5 و MiMo-V2.5-Pro پرده برداشت. تفاوت اصلی این مدل‌ها با نسل قبل که صرفا به پردازش متن و کد محدود بود، در قابلیت چندحالته (Multimodal) آن‌ها نهفته است؛ به‌طوری که هر دو نسخه جدید توانایی درک و پردازش همزمان تصویر، ویدیو و صدا را دارند.

به بیان ساده، کاربران می‌توانند برای مثال عکس داخل یخچال خود را بارگذاری کرده و دستور پخت متناسب با محتویات آن دریافت کنند، یا از یک ویدیوی آموزشی، خلاصه‌ای گام‌به‌گام تهیه نمایند.

دو مدل برای دو کاربرد متفاوت

شیائومی این دو مدل را با اهداف مجزایی طراحی کرده است:

MiMo-V2.5-Pro: مدلی حرفه‌ای برای انجام وظایف پیچیده و بلندمدت که ممکن است انجام آن‌ها برای انسان چندین روز زمان ببرد. سرعت پردازش این نسخه ۶۰ تا ۸۰ توکن در ثانیه است و هزینه استفاده از آن به ازای هر یک میلیون توکن، ۱ دلار برای ورودی و ۳ دلار برای خروجی اعلام شده است.

MiMo-V2.5: مدلی سریع‌تر (۱۰۰ تا ۱۵۰ توکن در ثانیه) و ارزان‌تر (۰.۴ دلار ورودی و ۲ دلار خروجی) که برای انجام وظایف روزمره کاربران طراحی شده و همچنان از تصویر، صدا و ویدیو پشتیبانی می‌کند.

هر دو مدل از پنجره زمینه (Context Window) به گستردگی یک میلیون توکن برخوردارند که معادل پردازش حدود ۷۵۰ هزار کلمه در یک مکالمه واحد است.

عملکرد در بنچمارک‌های معتبر

بر اساس ادعای شیائومی، مدل MiMo-V2.5-Pro در حوزه‌های قابلیت‌های عامل‌محور، مهندسی نرم‌افزار پیچیده و وظایف بلندمدت پیشرفت چشمگیری داشته و در بسیاری از معیارهای کدنویسی و ایجنت‌ها با مدل‌های پیشرفته‌ای همچون Claude Opus 4.6 و GPT-5.4 رقابت می‌کند.

هوش مصنوعی شیائومی MiMo-V2.5

جزئیات عملکرد این مدل در آزمون‌های استاندارد به شرح زیر است:

بنچمارک کدنویسی SWE-bench Pro: مدل MiMo-V2.5-Pro موفق به حل ۵۷.۲ درصد از وظایف شده که به مراتب بالاتر از میانگین ۲۵ درصدی سایر مدل‌هاست.

معیارهای τ3-bench و ClawEval: عملکرد این مدل نزدیک به Claude Opus 4.6 و GPT-5.4 گزارش شده است.

آزمون Humanity’s Last Exam: نمایانگر توانایی حل مسائل میان‌رشته‌ای دانشگاهی؛ MiMo امتیاز ۴۸ درصد را کسب کرده، در حالی که GPT-5.4 به امتیاز ۵۸.۷ درصد دست یافته است.

دسترسی و چشم‌انداز آینده

مدل‌های جدید هوش مصنوعی شیائومی هم‌اکنون از طریق AI Studio این شرکت و همچنین از طریق Xiaomi MiMo API قابل دسترسی هستند. غول فناوری چین که در ماه‌های اخیر تمرکز ویژه‌ای بر عرضه مدل‌های متنوع هوش مصنوعی داشته، اعلام کرده است که نسل بعدی این مدل‌ها را با ویژگی‌های «استدلال عمیق‌تر، ادغام دقیق‌تر ابزارها و پایه‌ریزی غنی‌تر در دنیای واقعی» آموزش می‌دهد.

برچسب ها