Sora 2 آمد: ویدیوهای هوش مصنوعی OpenAI مجهز به صدای همگام و دقت سینمایی

بیش از یک سال از زمانی که شرکت OpenAI از مدل تولید ویدیو و صدا (Video and Audio Generation Model) خود، یعنی Sora، رونمایی کرد، میگذرد. اکنون، OpenAI با معرفی مدل Sora 2، اولین بهروزرسانی بزرگ خود را در این حوزه ارائه میدهد؛ مدلی که میتواند ویدیوهایی با واقعگرایی و دقت فیزیکی بالاتر، به همراه کنترل کاربردی بهبود یافته و قابلیتهای ویرایش پیشرفتهتر تولید کند.
Sora 2 که به عنوان یک «لحظه GPT 3.5» در دنیای ویدیو توصیف شده است، خروجی صدای بهتری را نیز به همراه دارد؛ شامل دیالوگهای همگامسازی شده و جلوههای صوتی دقیق. این مدل جدید قادر است از مشکلات رایجی که در مدلهای پیشین تولید ویدیو مشاهده میشد، دوری کند؛ مشکلاتی نظیر تغییر شکل اشیاء و تحریف واقعیت فیزیکی برای تکمیل یک دستور متنی (Prompt).
علاوه بر این، ویدیوهای تولید شده توسط Sora 2 میتوانند از دستورالعملهای چندصحنهای پیروی کنند و ثبات و تداوم خود را در میان صحنههای مختلف حفظ نمایند. مدل Sora 2 از چندین سبک تولید ویدیو پشتیبانی میکند که شامل سبکهای سینمایی، واقعگرایانه (Realistic) و انیمه (Anime) میشود.
OpenAI همچنین در حال راهاندازی یک اپلیکیشن مستقل Sora برای سیستمعامل iOS است که در ابتدا با سیستم دعوتنامه (Invite-only) در دسترس خواهد بود.
Sora 2 برای تضمین استفادهی مسئولانه، مجهز به چندین مکانیزم حفاظتی است. این مکانیزمها شامل محدودیتهایی در استفاده از تصاویر افراد سرشناس و مشهور در تولید ویدیوها میشود. OpenAI همچنین تأیید کرده است که کاربران میتوانند به دیگران اجازه دهند تا با استفاده از شبیهسازی چهرهی آنها (Cameos)، ویدیو تولید کنند، اما این مجوز میتواند در هر زمان توسط کاربر اصلی لغو شود.
عرضه اولیهی Sora 2 از امروز (تاریخ انتشار خبر به میلادی) آغاز میشود و فعلاً به ایالات متحده و کانادا محدود خواهد بود. در خصوص قیمتگذاری نیز، OpenAI تأیید کرد که Sora 2 در ابتدا رایگان خواهد بود و دارای «محدودیتهای سخاوتمندانهای» است تا کاربران بتوانند قابلیتهای آن را به طور کامل کشف کنند.
همچنین، مشترکین ChatGPT Pro به مدل باکیفیتتر Sora 2 Pro دسترسی خواهند داشت. OpenAI در پایان، برنامههای خود برای انتشار زودهنگام API مدل Sora 2 را نیز تأیید کرد.
به مطالعه ادامه دهید: