رونمایی شیائومی از MiMo-V2.5؛ هوش مصنوعی با پردازش همزمان متن، تصویر، ویدیو و صدا

شرکت شیائومی تنها چند هفته پس از انتشار مدل MiMo-V2-Pro، از دو نسخه جدید از سامانه هوش مصنوعی خود با نامهای MiMo-V2.5 و MiMo-V2.5-Pro پرده برداشت. تفاوت اصلی این مدلها با نسل قبل که صرفا به پردازش متن و کد محدود بود، در قابلیت چندحالته (Multimodal) آنها نهفته است؛ بهطوری که هر دو نسخه جدید توانایی درک و پردازش همزمان تصویر، ویدیو و صدا را دارند.
به بیان ساده، کاربران میتوانند برای مثال عکس داخل یخچال خود را بارگذاری کرده و دستور پخت متناسب با محتویات آن دریافت کنند، یا از یک ویدیوی آموزشی، خلاصهای گامبهگام تهیه نمایند.
دو مدل برای دو کاربرد متفاوت
شیائومی این دو مدل را با اهداف مجزایی طراحی کرده است:
MiMo-V2.5-Pro: مدلی حرفهای برای انجام وظایف پیچیده و بلندمدت که ممکن است انجام آنها برای انسان چندین روز زمان ببرد. سرعت پردازش این نسخه ۶۰ تا ۸۰ توکن در ثانیه است و هزینه استفاده از آن به ازای هر یک میلیون توکن، ۱ دلار برای ورودی و ۳ دلار برای خروجی اعلام شده است.
MiMo-V2.5: مدلی سریعتر (۱۰۰ تا ۱۵۰ توکن در ثانیه) و ارزانتر (۰.۴ دلار ورودی و ۲ دلار خروجی) که برای انجام وظایف روزمره کاربران طراحی شده و همچنان از تصویر، صدا و ویدیو پشتیبانی میکند.
هر دو مدل از پنجره زمینه (Context Window) به گستردگی یک میلیون توکن برخوردارند که معادل پردازش حدود ۷۵۰ هزار کلمه در یک مکالمه واحد است.
عملکرد در بنچمارکهای معتبر
بر اساس ادعای شیائومی، مدل MiMo-V2.5-Pro در حوزههای قابلیتهای عاملمحور، مهندسی نرمافزار پیچیده و وظایف بلندمدت پیشرفت چشمگیری داشته و در بسیاری از معیارهای کدنویسی و ایجنتها با مدلهای پیشرفتهای همچون Claude Opus 4.6 و GPT-5.4 رقابت میکند.

جزئیات عملکرد این مدل در آزمونهای استاندارد به شرح زیر است:
بنچمارک کدنویسی SWE-bench Pro: مدل MiMo-V2.5-Pro موفق به حل ۵۷.۲ درصد از وظایف شده که به مراتب بالاتر از میانگین ۲۵ درصدی سایر مدلهاست.
معیارهای τ3-bench و ClawEval: عملکرد این مدل نزدیک به Claude Opus 4.6 و GPT-5.4 گزارش شده است.
آزمون Humanity’s Last Exam: نمایانگر توانایی حل مسائل میانرشتهای دانشگاهی؛ MiMo امتیاز ۴۸ درصد را کسب کرده، در حالی که GPT-5.4 به امتیاز ۵۸.۷ درصد دست یافته است.
دسترسی و چشمانداز آینده
مدلهای جدید هوش مصنوعی شیائومی هماکنون از طریق AI Studio این شرکت و همچنین از طریق Xiaomi MiMo API قابل دسترسی هستند. غول فناوری چین که در ماههای اخیر تمرکز ویژهای بر عرضه مدلهای متنوع هوش مصنوعی داشته، اعلام کرده است که نسل بعدی این مدلها را با ویژگیهای «استدلال عمیقتر، ادغام دقیقتر ابزارها و پایهریزی غنیتر در دنیای واقعی» آموزش میدهد.

