لوگو کارینا وب

سورا ۲ از OpenAI به اندروید آمد؛ هوش مصنوعی‌ای که واقعیت را بازسازی می‌کند

شرکت OpenAI با انتشار نسخه‌ی اندروید اپلیکیشن «Sora» و معرفی مدل تازه‌ی Sora 2، بار دیگر مرزهای واقعیت و تخیل را جابه‌جا کرد. این اپلیکیشن اکنون در گوگل‌پلی برای برخی کشورها عرضه شده و به کاربران اجازه می‌دهد تنها با یک فرمان متنی، ویدیوهای سینمایی و حتی بازسازی چهره‌ی خود یا دیگران را تولید کنند. در این گزارش به ویژگی‌های فنی Sora 2، قابلیت‌های نسخه اندروید، چالش‌های اخلاقی و آینده‌ی این فناوری پرداخته می‌شود.

فهرست مطالعه سریع:

OpenAI سرانجام پس از ماه‌ها انتظار، نسخه‌ی اندروید اپلیکیشن Sora را منتشر کرد؛ اپی که از آن به‌عنوان نقطه‌ی عطفی در تولید ویدیوهای مبتنی بر هوش مصنوعی یاد می‌شود. این اپلیکیشن هم‌اکنون در کشورهای آمریکا، کانادا، ژاپن، کره جنوبی، تایوان، تایلند و ویتنام از طریق فروشگاه Google Play در دسترس است و در آینده به سایر کشورها نیز گسترش خواهد یافت.

پیش‌تر، نسخه‌ی iOS سورا در شهریورماه منتشر شده بود و تنها طی پنج روز بیش از یک میلیون بار دانلود شد. حالا با عرضه‌ی نسخه‌ی اندروید، کاربران بیشتری می‌توانند از قابلیت‌های چشمگیر آن بهره ببرند.

 

سورا چیست و چه می‌کند؟

Sora در ظاهر ابزاری برای ساخت ویدیو از متن است، اما در عمل چیزی بسیار فراتر از یک تولیدکننده‌ی محتوا محسوب می‌شود. کاربران می‌توانند تنها با نوشتن دستوری ساده مانند «کودکی در حال دویدن زیر باران» و انتخاب سبک دلخواه، ویدیویی واقع‌گرایانه و چندثانیه‌ای بسازند.

نسخه‌ی جدید Sora با استفاده از مدل قدرتمند Sora 2، دقت بصری و عمق فیزیکی بی‌نظیری دارد. اشیا و انسان‌ها در این مدل بر اساس قوانین طبیعی شبیه‌سازی می‌شوند؛ به‌طوری‌که حتی انعکاس نور، سایه‌ها و حرکات ظریف باد نیز طبیعی به نظر می‌رسند.

 

مدل Sora 2؛ گامی به‌سوی شبیه‌سازی جهان

Sora 2 نسل جدیدی از مدل‌های تولید ویدیو است که بر پایه‌ی الگوریتم‌های Diffusion طراحی شده و می‌تواند از نویز تصادفی، ویدیوهایی منسجم و واقعی بسازد.

در این مدل مفهومی با عنوان «پیوستگی زمانی» معرفی شده است که موجب می‌شود چهره‌ها، اشیا و محیط‌ها در طول ویدیو ثابت و یکپارچه باقی بمانند. این قابلیت امکان تولید ویدیوهای بلند و بدون پرش‌های بصری را فراهم کرده است.

OpenAI هدف خود از توسعه‌ی Sora 2 را تنها خلق ویدیوهای چشم‌نواز نمی‌داند، بلکه به‌دنبال ساخت زیرساختی برای «شبیه‌سازهای جهان» است؛ سیستم‌هایی که در آینده می‌توانند در آموزش ربات‌ها و هوش‌های مصنوعی خودکار به‌کار گرفته شوند.

 

قابلیت‌های شاخص Sora 2

در نسخه‌ی تازه‌ی این اپلیکیشن مجموعه‌ای از امکانات جدید و پیشرفته ارائه شده که آن را از سایر ابزارهای مشابه متمایز می‌کند:

  • تولید ویدیوهایی با وضوح بالا تا سطح استاندارد سینمایی
  • درک طبیعی از نور، سایه و عمق میدان
  • حفظ تداوم فیزیکی حرکات و اشیای متحرک
  • پشتیبانی از دستورهای متنی چندشخصیتی و چندمرحله‌ای
  • افزودن گفتار و صداهای طبیعی هماهنگ با تصویر

این ویژگی‌ها باعث شده Sora 2 نه‌تنها ابزاری برای تولید ویدیو، بلکه بستری برای خلق روایت‌های بصری و خلاقانه باشد که کاربر در آن نقش کارگردان و نویسنده را هم‌زمان ایفا می‌کند.

 

Cameo؛ ویژگی جنجالی و محبوب

یکی از جنجالی‌ترین قابلیت‌های سورا ویژگی Cameo است. با استفاده از آن، کاربران می‌توانند چهره، صدا و حرکات خود را ضبط کرده و نسخه‌ای دیجیتال از خود بسازند. سپس این «آواتار شخصی» در صحنه‌های دلخواه ظاهر می‌شود؛ از دویدن در مناظر طبیعی گرفته تا ایفای نقش در داستان‌های تاریخی.

برای فعال‌سازی این قابلیت، کاربر باید ویدیوی کوتاهی از چهره و صدای خود ارائه دهد تا مدل بتواند نسخه‌ی دیجیتالی او را تولید کند. داده‌ها به‌صورت رمزگذاری‌شده ذخیره می‌شوند و کاربر هر زمان بخواهد می‌تواند آنها را حذف کند.

Cameo به‌سرعت محبوب شده، اما نگرانی‌هایی نیز درباره‌ی احتمال سوءاستفاده از آن برای ساخت دیپ‌فیک‌ها یا بازسازی چهره‌ی افراد مشهور ایجاد کرده است.

 

چالش‌های اخلاقی و حقوقی

OpenAI اعلام کرده است که استفاده از چهره‌ی افراد زنده بدون رضایت آنها به‌طور کامل ممنوع است. همچنین همه‌ی ویدیوهای تولیدشده در Sora دارای واترمارک نامرئی هستند تا در صورت نیاز، منشأ آن‌ها قابل‌ردیابی باشد.

در بیانیه‌ی رسمی این شرکت آمده است که برای جلوگیری از سوءاستفاده، از ترکیبی از فیلترهای خودکار، سیستم‌های تشخیص چهره‌ی هوشمند و بازبینی انسانی استفاده می‌شود. با این حال، بحث‌های اخلاقی در مورد بازسازی چهره‌ی شخصیت‌های درگذشته یا چهره‌های دارای حق نشر همچنان ادامه دارد.

OpenAI همچنین اعلام کرده که در نسخه‌های آینده، به صاحبان آثار و چهره‌های عمومی اجازه خواهد داد تا در صورت تمایل برای استفاده از چهره یا شخصیت خود در ویدیوهای سورا هزینه‌ای دریافت کنند.

 

رویکرد تازه‌ی OpenAI

برخلاف بسیاری از مدل‌های قبلی که تنها از طریق API برای توسعه‌دهندگان در دسترس بودند، سورا مستقیماً به شکل یک اپلیکیشن اجتماعی منتشر شده است. هدف از این تغییر، فراهم‌کردن بستری برای کاربران عادی است تا بتوانند بدون نیاز به دانش فنی، محتوای ویدیویی خلق کنند.

الگوریتم فید در سورا نیز برای نمایش ویدیوهای الهام‌بخش طراحی شده و نه برای افزایش زمان حضور کاربر در برنامه. در حال حاضر، استفاده از سورا رایگان است، اما OpenAI در نظر دارد در آینده برای تولید ویدیوهای طولانی‌تر یا کیفیت بالاتر، مدل اشتراکی یا پرداخت درون‌برنامه‌ای را فعال کند.

این تصمیم می‌تواند الگویی نوین برای ترکیب هوش مصنوعی، شبکه‌های اجتماعی و اقتصاد خلاق باشد.

 

واکنش‌ها و دیدگاه‌ها

عرضه‌ی Sora 2 و نسخه‌ی اندروید آن موجی از بازخوردهای مثبت و منفی به‌همراه داشته است. بسیاری از کاربران از سطح واقع‌گرایی و سادگی استفاده از این اپ شگفت‌زده شده‌اند، در حالی که کارشناسان نسبت به پیامدهای اخلاقی آن هشدار داده‌اند.

برخی متخصصان معتقدند Sora می‌تواند مرز میان فیلم‌سازی حرفه‌ای و تولید محتوای شخصی را از میان بردارد. با این حال، نگرانی درباره‌ی آینده‌ی مشاغل خلاق و اصالت هنری همچنان وجود دارد.

به گفته‌ی توسعه‌دهندگان، نسخه‌های آینده‌ی Sora شامل ابزارهایی برای همکاری گروهی، ویرایش ویدیو و حتی تعامل زنده با آواتارها خواهد بود.

 

آینده‌ای که در راه است

OpenAI اعلام کرده است که هدف نهایی پروژه‌ی Sora ایجاد شبیه‌سازهای چندجهانی است؛ سامانه‌هایی که نه‌تنها می‌توانند ویدیو تولید کنند، بلکه در محیط‌های مجازی با قوانین فیزیکی واقعی، سناریوهای آموزشی و تجربی برای هوش مصنوعی‌ها فراهم کنند.

چنین فناوری‌هایی می‌توانند انقلابی در آموزش، سرگرمی و طراحی صنعتی ایجاد کنند. اما همان‌طور که بسیاری از کارشناسان هشدار داده‌اند، مرز میان واقعیت و خیال هر روز کمرنگ‌تر می‌شود و مسئولیت‌پذیری کاربران در استفاده از این ابزارها اهمیت فزاینده‌ای دارد.

Sora در حال حاضر تنها یک اپلیکیشن است، اما می‌تواند مقدمه‌ای بر دنیایی باشد که در آن «تخیل»، با دقت فیزیکی و علمی بازسازی می‌شود.

منبع: openai.com

تصویر کارینا وب
کارینا وب

ما اینجا براتون روی بهترین آموزش ها، مقالات و اخبار بروز دیجیتال مارکتینگ، سئو SEO سایت، هوش مصنوعی و کدنویسی و شبکه و امنیت سایبری کار میکنیم. تا با هم رشد کنیم :) سوال یا انتقادی داشتین کامنت بزارین همین زیر چون قول میدیم که سریع بخونیم و جواب بدیم :))

دیگر مقالات و اخبار

نظرات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *