در این گزارش خبری اختصاصی در کارینا وب، به جزئیات معرفی چشمگیر مدل هوش مصنوعی LTX-2 از سوی شرکت لایتریکس میپردازیم. این شرکت با رونمایی از جدیدترین ابزار خود، نه تنها سرعت تولید ویدئو را افزایش داده، بلکه سطح کیفیت و وضوح را به طرز بیسابقهای ارتقاء بخشیده است.
LTX-2 متنباز، رندری سریعتر از واقعیت
مدل LTX-2، که تحت مجوز متنباز منتشر شده است، یک ویدئوی شش ثانیهای با کیفیت بالا و استایل ویژه را تنها در پنج ثانیه تولید میکند. این سرعت خیرهکننده به تولیدکنندگان محتوا اجازه میدهد تا بدون افت کیفیت، محتوای حرفهای را با چرخههای تکرار (Iteration) فوقالعاده سریع به بازار عرضه کنند.
اما وجه تمایز LTX-2 تنها به سرعت آن خلاصه نمیشود. این مدل:
- سنتز بومی صدا و ویدئو: برای اولین بار، قابلیت تولید همزمان صدا (شامل موسیقی متن، دیالوگ و جلوههای محیطی) و تصویر را یکپارچه کرده است. این قابلیت، که پیشتر در مدلهایی چون Veo گوگل مورد توجه قرار گرفته بود، نیاز به ادغام و همگامسازی دستی صدا و تصویر را به طور کامل از بین میبرد و گردش کار (Workflow) خلاقانه را تسریع میبخشد.
- کیفیت سینمایی 4K: کاربران با صرف چند ثانیه زمان بیشتر، میتوانند خروجی ویدئویی خود را تا وضوح 4K و نرخ 48 فریم بر ثانیه ارتقا دهند، کیفیتی که تا پیش از این مختص تولیدات سینمایی بود.
- دسترسی همگانی: امکان اجرای نرمافزار بر روی پردازندههای گرافیکی سطح مصرفکننده (Consumer-grade GPUs)، هزینههای محاسباتی را به طور چشمگیری کاهش میدهد و دموکراتیزه شدن تولید ویدئوی حرفهای را تسریع میبخشد.
مدلهای انتشار به بلوغ میرسند
زئو فاربمن، همبنیانگذار و مدیر اجرایی لایتریکس، ضمن تأکید بر تحول مدلهای انتشار، بیان کرد: «LTX-2 جامعترین و کاملترین موتور هوش مصنوعی خلاقانه است که تاکنون ساختهایم؛ ترکیبی از صدای و تصویر همگام، وفاداری 4K، جریانهای کاری انعطافپذیر و کارایی رادیکال.» او اضافه کرد: «این یک نمایش تحقیقاتی یا نرمافزار فرضی نیست، بلکه یک پیشرفت واقعی در تولید ویدئو است.»
این مدل ادامه مسیر موفقیتآمیز خانواده مدلهای LTXV است که پیشتر با مدلهای LTXV-2B و LTXV-13B، نوآوریهایی چون پشتیبانی از تولید ویدئوهای طولانی (تا 60 ثانیه) و رندر چند مقیاسی را معرفی کرده بود؛ قابلیتی که به کاربران اجازه میدهد جزئیات و رنگها را به صورت تدریجی، شبیه به لایهبندی در فرآیندهای انیمیشن سنتی، به ویدئو اضافه کنند. لازم به ذکر است که مدل 13B با دادههای مجاز از Getty و Shutterstock آموزش دیده که اطمینان از مسائل حق نشر (کپیرایت) را فراهم میآورد.
مدلهای اقتصادی نوین در API
LTX-2 از هماکنون از طریق پلتفرم LTX Studio و API قابل استفاده است و نسخه کامل متنباز آن قرار است در ماه نوامبر در گیتهاب (GitHub) منتشر شود.
لایتریکس برای نسخه پولی از طریق API، یک مدل قیمتگذاری انعطافپذیر و اقتصادی را ارائه کرده که آن را تا 50 درصد ارزانتر از مدلهای رقیب میسازد:
- نسخه HD سریع: از 0.04 دلار در ثانیه (تولید ویدئو در 5 ثانیه).
- نسخه پرو (تعادل سرعت و عملکرد): از 0.07 دلار در ثانیه.
- نسخه اولترا (4K و 48 فریم بر ثانیه با صدای کامل): 0.12 دلار در ثانیه.
این قیمتگذاری، پروژههای طولانیتر را از نظر اقتصادی توجیهپذیرتر میکند، در حالی که بالاترین کیفیت و سریعترین نرخ تکرار را تضمین مینماید.
منبع: AI News



