OpenAI سرانجام پس از ماهها انتظار، نسخهی اندروید اپلیکیشن Sora را منتشر کرد؛ اپی که از آن بهعنوان نقطهی عطفی در تولید ویدیوهای مبتنی بر هوش مصنوعی یاد میشود. این اپلیکیشن هماکنون در کشورهای آمریکا، کانادا، ژاپن، کره جنوبی، تایوان، تایلند و ویتنام از طریق فروشگاه Google Play در دسترس است و در آینده به سایر کشورها نیز گسترش خواهد یافت.
پیشتر، نسخهی iOS سورا در شهریورماه منتشر شده بود و تنها طی پنج روز بیش از یک میلیون بار دانلود شد. حالا با عرضهی نسخهی اندروید، کاربران بیشتری میتوانند از قابلیتهای چشمگیر آن بهره ببرند.
سورا چیست و چه میکند؟
Sora در ظاهر ابزاری برای ساخت ویدیو از متن است، اما در عمل چیزی بسیار فراتر از یک تولیدکنندهی محتوا محسوب میشود. کاربران میتوانند تنها با نوشتن دستوری ساده مانند «کودکی در حال دویدن زیر باران» و انتخاب سبک دلخواه، ویدیویی واقعگرایانه و چندثانیهای بسازند.
نسخهی جدید Sora با استفاده از مدل قدرتمند Sora 2، دقت بصری و عمق فیزیکی بینظیری دارد. اشیا و انسانها در این مدل بر اساس قوانین طبیعی شبیهسازی میشوند؛ بهطوریکه حتی انعکاس نور، سایهها و حرکات ظریف باد نیز طبیعی به نظر میرسند.
مدل Sora 2؛ گامی بهسوی شبیهسازی جهان
Sora 2 نسل جدیدی از مدلهای تولید ویدیو است که بر پایهی الگوریتمهای Diffusion طراحی شده و میتواند از نویز تصادفی، ویدیوهایی منسجم و واقعی بسازد.
در این مدل مفهومی با عنوان «پیوستگی زمانی» معرفی شده است که موجب میشود چهرهها، اشیا و محیطها در طول ویدیو ثابت و یکپارچه باقی بمانند. این قابلیت امکان تولید ویدیوهای بلند و بدون پرشهای بصری را فراهم کرده است.
OpenAI هدف خود از توسعهی Sora 2 را تنها خلق ویدیوهای چشمنواز نمیداند، بلکه بهدنبال ساخت زیرساختی برای «شبیهسازهای جهان» است؛ سیستمهایی که در آینده میتوانند در آموزش رباتها و هوشهای مصنوعی خودکار بهکار گرفته شوند.
قابلیتهای شاخص Sora 2
در نسخهی تازهی این اپلیکیشن مجموعهای از امکانات جدید و پیشرفته ارائه شده که آن را از سایر ابزارهای مشابه متمایز میکند:
- تولید ویدیوهایی با وضوح بالا تا سطح استاندارد سینمایی
- درک طبیعی از نور، سایه و عمق میدان
- حفظ تداوم فیزیکی حرکات و اشیای متحرک
- پشتیبانی از دستورهای متنی چندشخصیتی و چندمرحلهای
- افزودن گفتار و صداهای طبیعی هماهنگ با تصویر
این ویژگیها باعث شده Sora 2 نهتنها ابزاری برای تولید ویدیو، بلکه بستری برای خلق روایتهای بصری و خلاقانه باشد که کاربر در آن نقش کارگردان و نویسنده را همزمان ایفا میکند.
Cameo؛ ویژگی جنجالی و محبوب
یکی از جنجالیترین قابلیتهای سورا ویژگی Cameo است. با استفاده از آن، کاربران میتوانند چهره، صدا و حرکات خود را ضبط کرده و نسخهای دیجیتال از خود بسازند. سپس این «آواتار شخصی» در صحنههای دلخواه ظاهر میشود؛ از دویدن در مناظر طبیعی گرفته تا ایفای نقش در داستانهای تاریخی.
برای فعالسازی این قابلیت، کاربر باید ویدیوی کوتاهی از چهره و صدای خود ارائه دهد تا مدل بتواند نسخهی دیجیتالی او را تولید کند. دادهها بهصورت رمزگذاریشده ذخیره میشوند و کاربر هر زمان بخواهد میتواند آنها را حذف کند.
Cameo بهسرعت محبوب شده، اما نگرانیهایی نیز دربارهی احتمال سوءاستفاده از آن برای ساخت دیپفیکها یا بازسازی چهرهی افراد مشهور ایجاد کرده است.
چالشهای اخلاقی و حقوقی
OpenAI اعلام کرده است که استفاده از چهرهی افراد زنده بدون رضایت آنها بهطور کامل ممنوع است. همچنین همهی ویدیوهای تولیدشده در Sora دارای واترمارک نامرئی هستند تا در صورت نیاز، منشأ آنها قابلردیابی باشد.
در بیانیهی رسمی این شرکت آمده است که برای جلوگیری از سوءاستفاده، از ترکیبی از فیلترهای خودکار، سیستمهای تشخیص چهرهی هوشمند و بازبینی انسانی استفاده میشود. با این حال، بحثهای اخلاقی در مورد بازسازی چهرهی شخصیتهای درگذشته یا چهرههای دارای حق نشر همچنان ادامه دارد.
OpenAI همچنین اعلام کرده که در نسخههای آینده، به صاحبان آثار و چهرههای عمومی اجازه خواهد داد تا در صورت تمایل برای استفاده از چهره یا شخصیت خود در ویدیوهای سورا هزینهای دریافت کنند.
رویکرد تازهی OpenAI
برخلاف بسیاری از مدلهای قبلی که تنها از طریق API برای توسعهدهندگان در دسترس بودند، سورا مستقیماً به شکل یک اپلیکیشن اجتماعی منتشر شده است. هدف از این تغییر، فراهمکردن بستری برای کاربران عادی است تا بتوانند بدون نیاز به دانش فنی، محتوای ویدیویی خلق کنند.
الگوریتم فید در سورا نیز برای نمایش ویدیوهای الهامبخش طراحی شده و نه برای افزایش زمان حضور کاربر در برنامه. در حال حاضر، استفاده از سورا رایگان است، اما OpenAI در نظر دارد در آینده برای تولید ویدیوهای طولانیتر یا کیفیت بالاتر، مدل اشتراکی یا پرداخت درونبرنامهای را فعال کند.
این تصمیم میتواند الگویی نوین برای ترکیب هوش مصنوعی، شبکههای اجتماعی و اقتصاد خلاق باشد.
واکنشها و دیدگاهها
عرضهی Sora 2 و نسخهی اندروید آن موجی از بازخوردهای مثبت و منفی بههمراه داشته است. بسیاری از کاربران از سطح واقعگرایی و سادگی استفاده از این اپ شگفتزده شدهاند، در حالی که کارشناسان نسبت به پیامدهای اخلاقی آن هشدار دادهاند.
برخی متخصصان معتقدند Sora میتواند مرز میان فیلمسازی حرفهای و تولید محتوای شخصی را از میان بردارد. با این حال، نگرانی دربارهی آیندهی مشاغل خلاق و اصالت هنری همچنان وجود دارد.
به گفتهی توسعهدهندگان، نسخههای آیندهی Sora شامل ابزارهایی برای همکاری گروهی، ویرایش ویدیو و حتی تعامل زنده با آواتارها خواهد بود.
آیندهای که در راه است
OpenAI اعلام کرده است که هدف نهایی پروژهی Sora ایجاد شبیهسازهای چندجهانی است؛ سامانههایی که نهتنها میتوانند ویدیو تولید کنند، بلکه در محیطهای مجازی با قوانین فیزیکی واقعی، سناریوهای آموزشی و تجربی برای هوش مصنوعیها فراهم کنند.
چنین فناوریهایی میتوانند انقلابی در آموزش، سرگرمی و طراحی صنعتی ایجاد کنند. اما همانطور که بسیاری از کارشناسان هشدار دادهاند، مرز میان واقعیت و خیال هر روز کمرنگتر میشود و مسئولیتپذیری کاربران در استفاده از این ابزارها اهمیت فزایندهای دارد.
Sora در حال حاضر تنها یک اپلیکیشن است، اما میتواند مقدمهای بر دنیایی باشد که در آن «تخیل»، با دقت فیزیکی و علمی بازسازی میشود.
منبع: openai.com



