گوگل از Gemini Omni Flash رونمایی کرد؛ تولید و ویرایش ویدیو با هوش مصنوعی و تنها یک دستور متنی

سعید میرزاپور

23 ساعت پیش

گوگل از مدل جدید Gemini Omni Flash پرده برداشت؛ هوش مصنوعی تازه‌ای که با هدف تولید و ویرایش ویدیو با سرعت بالا و هزینه پردازش کمتر توسعه یافته است. این مدل از امروز از طریق Google AI Studio و Gemini API در اختیار توسعه‌دهندگان قرار گرفته تا بتوانند از قابلیت‌های آن در پروژه‌های مختلف استفاده کنند.

Gemini Omni Flash به‌عنوان یکی از اعضای خانواده مدل‌های چندوجهی گوگل، امکان ساخت یا ویرایش ویدیو را تنها با استفاده از دستورات متنی فراهم می‌کند. کاربران می‌توانند با نوشتن درخواست خود به زبان طبیعی، تغییرات موردنظر را روی ویدیو اعمال کنند؛ از بازطراحی صحنه‌ها و تغییر سبک بصری گرفته تا اصلاح یا بازنویسی بخش‌های مختلف ویدیو، بدون نیاز به ابزارهای پیچیده تدوین.

هوش مصنوعی چندرسانه‌ای گوگل برای تولید انواع محتوا

خانواده Gemini Omni با هدف یکپارچه‌سازی قابلیت‌های هوش مصنوعی توسعه یافته است. این مدل‌ها قادر هستند به‌صورت هم‌زمان متن، تصویر، صدا و ویدیو را درک کرده و تولید کنند؛ قابلیتی که توسعه برنامه‌های مبتنی بر هوش مصنوعی را ساده‌تر می‌کند و نیاز به استفاده از چند مدل مجزا را از بین می‌برد.

Gemini Omni Flash

گوگل اعلام کرده است که نسخه Flash این خانواده به‌طور ویژه برای افزایش سرعت پاسخ‌دهی و کاهش هزینه‌های پردازش بهینه‌سازی شده است. به همین دلیل، این مدل گزینه‌ای مناسب برای توسعه ابزارهای تعاملی، تولید محتوای ویدیویی و انجام ویرایش‌های هوشمند با کمترین میزان تأخیر محسوب می‌شود.

رقابت داغ گوگل با بازیگران بازار ویدیوی هوش مصنوعی

معرفی Gemini Omni Flash در شرایطی انجام می‌شود که رقابت در حوزه تولید و ویرایش ویدیو با هوش مصنوعی بیش از هر زمان دیگری شدت گرفته است. طی ماه‌های اخیر، شرکت‌هایی مانند OpenAI، Runway، Pika و Luma نیز مدل‌های پیشرفته‌ای را برای ساخت و ویرایش ویدیو معرفی کرده‌اند.

گوگل با توسعه خانواده Gemini Omni و عرضه نسخه Flash تلاش می‌کند جایگاه خود را در بازار ابزارهای هوش مصنوعی مولد حفظ کرده و سهم بیشتری از بازار روبه‌رشد تولید محتوای ویدیویی را به دست آورد.