24 مهر 1404
تکنیکهای موجود انیمیشن هوش مصنوعی اغلب بین قابلیت فیزیکی و کنترلپذیری یک معاوضه (سازش) ایجاد میکنند و غالباً نمیتوانند هم حرکت واقعگرایانه و هم حرکت قابل مدیریت آسان را ارائه دهند. یک روش جدید به نام دیفیوزکلاک با تولید انیمیشنهای قابل کنترل و واقعگرایانه مستقیماً از مجموعهای متنوع از دادههای موشنکپچر، این مشکل را برطرف میکند و محدودیتهای قبلی را به طور موثری حل میکند.

تکنیکهای انیمیشن مبتنی بر هوش مصنوعی موجود، یا حرکتهای قابل قبولی از نظر فیزیکی تولید میکنند که کنترل آنها دشوار است، یا حرکتهای قابل کنترلی که فاقد واقعگرایی هستند، و این برای انیماتورها یک دوراهی ایجاد میکند.
تکنیکهای کلاسیک انیمیشن از هنرمندان میخواهند که هر حرکت را به صورت دستی تولید کنند، فرآیندی که بسیار پرزحمت و زمانبر است.
یک تکنیک جدید انیمیشن هوش مصنوعی به نام دیفیوزکلاک، بهترینهای هر دو دنیا را ترکیب میکند و حرکتهای قابل کنترل و قابل قبول از نظر فیزیکی را از یک 'سوپ' از دادههای متنوع موشنکپچر تولید میکند.
این تکنیک جدید به شخصیتهای متحرک این امکان را میدهد که به طور خودکار از موانع ثابت مانند دیوارها بدون برنامهنویسی صریح دوری کنند.
شخصیتهای متحرک با این روش میتوانند به طور موثری از برخورد با سایر موجودیتهای متحرک تحت کنترل هوش مصنوعی، حتی در محیطهای پیچیده و پویا، جلوگیری کنند.
روش دیفیوزکلاک به طور کارآمد توالیهای انیمیشن طولانی و پیوسته را مدیریت و تولید میکند.
این تکنیک تعمیمپذیری قدرتمندی را نشان میدهد که به شخصیتها اجازه میدهد اقدامات جدیدی را در موقعیتهایی که قبلاً با آنها روبرو نشدهاند، مانند پریدن از روی چندین ستون دیده نشده، انجام دهند.
کاربران میتوانند دو یا چند حالت هدف را مشخص کنند و این روش به طور یکپارچه انتقال حرکت بین آنها را تولید میکند، قابلیتی که اغلب در سایر تکنیکهای هوش مصنوعی مبتنی بر انتشار (diffusion) وجود ندارد.
شخصیتهای متحرک مقاومت قابل توجهی در برابر اختلالات و اغتشاشات خارجی از خود نشان میدهند و حرکت مورد نظر خود را با وجود تداخل حفظ میکنند.
هوش مصنوعی یاد میگیرد که حرکات ورودی نامربوط را به هم ببافد و آنها را در موقعیتهای جدید به کار گیرد، و به جای صرفاً دنبال کردن یک رقصآرایی از پیش تعریف شده، حرکات آینده را پیشبینی میکند.
مدل را میتوان در یک GPU تنها در عرض 24 ساعت آموزش داد که آن را بسیار در دسترس و آسان برای استقرار میکند.
این مدل با یادگیری Zero-Shot کار میکند، نیازی به آموزش مجدد یا تنظیمات خاص وظیفه ندارد و پتانسیل قابل توجهی برای ایجاد شخصیتهای بازی، آواتارهای VR و رباتهایی با حرکت طبیعی دارد.
این هوش مصنوعی جدید مانند آموزش دادن به یک رقصنده است، نه فقط گامها را، بلکه نحوه حس کردن ریتم را چند ثانیه جلوتر – به طوری که هر حرکت از قبل پیشبینی میکند چه چیزی در ادامه میآید.
| ویژگی | توضیحات |
|---|---|
| حرکت قابل کنترل و واقعگرایانه | حرکت بسیار قابل کنترل و قابل قبول از نظر فیزیکی را از دادههای متنوع موشنکپچر تولید میکند و بر معاوضههای سنتی غلبه میکند. |
| اجتناب از موانع ثابت | شخصیتها را قادر میسازد تا به طور خودکار در اطراف اشیاء ثابت مانند دیوارها حرکت کنند. |
| اجتناب از موانع پویا | به شخصیتها اجازه میدهد تا از برخورد با سایر موجودیتهای متحرک تحت کنترل هوش مصنوعی در محیطهای پویا جلوگیری کنند. |
| توالیهای انیمیشن طولانیتر | توالیهای انیمیشن طولانی و پیوسته را به طور کارآمد مدیریت و تولید میکند. |
| تعمیم به سناریوهای دیده نشده | توانایی انجام اقدامات جدید در موقعیتهایی که در طول آموزش با آنها روبرو نشده است، مانند پریدن از روی چندین ستون، را نشان میدهد. |
| درونیابی حالت (پوز) | انتقال حرکت روان و طبیعی بین دو یا چند حالت مشخص شده را تولید میکند، قابلیتی منحصر به فرد برای روشهای مبتنی بر انتشار (diffusion). |
| مقاومت در برابر اختلالات | شخصیتها حتی در صورت قرار گرفتن در معرض اختلالات فیزیکی خارجی، حرکت و ثبات خود را حفظ میکنند. |
| آموزش کارآمد | مدل را میتوان به سرعت آموزش داد و تنها به یک GPU به مدت 24 ساعت نیاز دارد. |
| یادگیری Zero-Shot | بدون نیاز به آموزش مجدد یا تنظیمات خاص وظیفه عمل میکند و برای کاربردهایی مانند شخصیتهای بازی یا آواتارهای VR، بدون نیاز به تنظیمات اولیه، با سناریوهای مختلف سازگار میشود. |
