لوگو کارینا وب

ویدئوی هوش مصنوعی متن‌باز Lightricks: جهشی بزرگ در کیفیت 4K و سرعت رندرینگ فوق‌سریع

شرکت پیشرو لایتریکس (Lightricks) با معرفی مدل بنیادین هوش مصنوعی متن‌باز خود با نام LTX-2، استانداردهای جدیدی را در صنعت تولید محتوای ویدئویی رقم زد. این مدل انقلابی نه تنها قادر است محتوای ویدئویی جدید را با سرعتی فراتر از سرعت پخش رندر کند، بلکه برای اولین بار به صورت بومی، سنتز همزمان صدا و ویدئو را با کیفیت بی‌نظیر 4K و 48 فریم بر ثانیه ارائه می‌دهد. این گشایش، تولید محتوای سینمایی را برای همگان، حتی با استفاده از کارت‌های گرافیک معمولی، مقرون به صرفه و در دسترس می‌سازد.

فهرست مطالعه سریع:

در این گزارش خبری اختصاصی در کارینا وب، به جزئیات معرفی چشمگیر مدل هوش مصنوعی LTX-2 از سوی شرکت لایتریکس می‌پردازیم. این شرکت با رونمایی از جدیدترین ابزار خود، نه تنها سرعت تولید ویدئو را افزایش داده، بلکه سطح کیفیت و وضوح را به طرز بی‌سابقه‌ای ارتقاء بخشیده است.

LTX-2 متن‌باز، رندری سریع‌تر از واقعیت

مدل LTX-2، که تحت مجوز متن‌باز منتشر شده است، یک ویدئوی شش ثانیه‌ای با کیفیت بالا و استایل ویژه را تنها در پنج ثانیه تولید می‌کند. این سرعت خیره‌کننده به تولیدکنندگان محتوا اجازه می‌دهد تا بدون افت کیفیت، محتوای حرفه‌ای را با چرخه‌های تکرار (Iteration) فوق‌العاده سریع به بازار عرضه کنند.

اما وجه تمایز LTX-2 تنها به سرعت آن خلاصه نمی‌شود. این مدل:

  • سنتز بومی صدا و ویدئو: برای اولین بار، قابلیت تولید همزمان صدا (شامل موسیقی متن، دیالوگ و جلوه‌های محیطی) و تصویر را یکپارچه کرده است. این قابلیت، که پیشتر در مدل‌هایی چون Veo گوگل مورد توجه قرار گرفته بود، نیاز به ادغام و همگام‌سازی دستی صدا و تصویر را به طور کامل از بین می‌برد و گردش کار (Workflow) خلاقانه را تسریع می‌بخشد.
  • کیفیت سینمایی 4K: کاربران با صرف چند ثانیه زمان بیشتر، می‌توانند خروجی ویدئویی خود را تا وضوح 4K و نرخ 48 فریم بر ثانیه ارتقا دهند، کیفیتی که تا پیش از این مختص تولیدات سینمایی بود.
  • دسترسی همگانی: امکان اجرای نرم‌افزار بر روی پردازنده‌های گرافیکی سطح مصرف‌کننده (Consumer-grade GPUs)، هزینه‌های محاسباتی را به طور چشمگیری کاهش می‌دهد و دموکراتیزه شدن تولید ویدئوی حرفه‌ای را تسریع می‌بخشد.

مدل‌های انتشار به بلوغ می‌رسند

زئو فاربمن، هم‌بنیان‌گذار و مدیر اجرایی لایتریکس، ضمن تأکید بر تحول مدل‌های انتشار، بیان کرد: «LTX-2 جامع‌ترین و کامل‌ترین موتور هوش مصنوعی خلاقانه است که تاکنون ساخته‌ایم؛ ترکیبی از صدای و تصویر همگام، وفاداری 4K، جریان‌های کاری انعطاف‌پذیر و کارایی رادیکال.» او اضافه کرد: «این یک نمایش تحقیقاتی یا نرم‌افزار فرضی نیست، بلکه یک پیشرفت واقعی در تولید ویدئو است.»

این مدل ادامه مسیر موفقیت‌آمیز خانواده مدل‌های LTXV است که پیشتر با مدل‌های LTXV-2B و LTXV-13B، نوآوری‌هایی چون پشتیبانی از تولید ویدئوهای طولانی (تا 60 ثانیه) و رندر چند مقیاسی را معرفی کرده بود؛ قابلیتی که به کاربران اجازه می‌دهد جزئیات و رنگ‌ها را به صورت تدریجی، شبیه به لایه‌بندی در فرآیندهای انیمیشن سنتی، به ویدئو اضافه کنند. لازم به ذکر است که مدل 13B با داده‌های مجاز از Getty و Shutterstock آموزش دیده که اطمینان از مسائل حق نشر (کپی‌رایت) را فراهم می‌آورد.

مدل‌های اقتصادی نوین در API

LTX-2 از هم‌اکنون از طریق پلتفرم LTX Studio و API قابل استفاده است و نسخه کامل متن‌باز آن قرار است در ماه نوامبر در گیت‌هاب (GitHub) منتشر شود.

لایتریکس برای نسخه پولی از طریق API، یک مدل قیمت‌گذاری انعطاف‌پذیر و اقتصادی را ارائه کرده که آن را تا 50 درصد ارزان‌تر از مدل‌های رقیب می‌سازد:

  • نسخه HD سریع: از 0.04 دلار در ثانیه (تولید ویدئو در 5 ثانیه).
  • نسخه پرو (تعادل سرعت و عملکرد): از 0.07 دلار در ثانیه.
  • نسخه اولترا (4K و 48 فریم بر ثانیه با صدای کامل): 0.12 دلار در ثانیه.

این قیمت‌گذاری، پروژه‌های طولانی‌تر را از نظر اقتصادی توجیه‌پذیرتر می‌کند، در حالی که بالاترین کیفیت و سریع‌ترین نرخ تکرار را تضمین می‌نماید.

منبع: AI News

تصویر کارینا وب
کارینا وب

ما اینجا براتون روی بهترین آموزش ها، مقالات و اخبار بروز دیجیتال مارکتینگ، سئو SEO سایت، هوش مصنوعی و کدنویسی و شبکه و امنیت سایبری کار میکنیم. تا با هم رشد کنیم :) سوال یا انتقادی داشتین کامنت بزارین همین زیر چون قول میدیم که سریع بخونیم و جواب بدیم :))

دیگر مقالات و اخبار

نظرات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *