دیفیوزکلاک: یک تکنیک جدید، قابل کنترل و واقع‌گرایانه انیمیشن هوش مصنوعی

تکنیک‌های موجود انیمیشن هوش مصنوعی اغلب بین قابلیت فیزیکی و کنترل‌پذیری یک معاوضه (سازش) ایجاد می‌کنند و غالباً نمی‌توانند هم حرکت واقع‌گرایانه و هم حرکت قابل مدیریت آسان را ارائه دهند. یک روش جدید به نام دیفیوزکلاک با تولید انیمیشن‌های قابل کنترل و واقع‌گرایانه مستقیماً از مجموعه‌ای متنوع از داده‌های موشن‌کپچر، این مشکل را برطرف می‌کند و محدودیت‌های قبلی را به طور موثری حل می‌کند.

image

خلاصه نکات کلیدی

  • چالش‌های فعلی انیمیشن هوش مصنوعی

    تکنیک‌های انیمیشن مبتنی بر هوش مصنوعی موجود، یا حرکت‌های قابل قبولی از نظر فیزیکی تولید می‌کنند که کنترل آن‌ها دشوار است، یا حرکت‌های قابل کنترلی که فاقد واقع‌گرایی هستند، و این برای انیماتورها یک دوراهی ایجاد می‌کند.

  • تکنیک‌های کلاسیک انیمیشن

    تکنیک‌های کلاسیک انیمیشن از هنرمندان می‌خواهند که هر حرکت را به صورت دستی تولید کنند، فرآیندی که بسیار پرزحمت و زمان‌بر است.

  • معرفی روش دیفیوزکلاک

    یک تکنیک جدید انیمیشن هوش مصنوعی به نام دیفیوزکلاک، بهترین‌های هر دو دنیا را ترکیب می‌کند و حرکت‌های قابل کنترل و قابل قبول از نظر فیزیکی را از یک 'سوپ' از داده‌های متنوع موشن‌کپچر تولید می‌کند.

  • اجتناب از موانع ثابت

    این تکنیک جدید به شخصیت‌های متحرک این امکان را می‌دهد که به طور خودکار از موانع ثابت مانند دیوارها بدون برنامه‌نویسی صریح دوری کنند.

  • اجتناب از موانع پویا

    شخصیت‌های متحرک با این روش می‌توانند به طور موثری از برخورد با سایر موجودیت‌های متحرک تحت کنترل هوش مصنوعی، حتی در محیط‌های پیچیده و پویا، جلوگیری کنند.

  • توالی‌های طولانی انیمیشن

    روش دیفیوزکلاک به طور کارآمد توالی‌های انیمیشن طولانی و پیوسته را مدیریت و تولید می‌کند.

  • قابلیت‌های تعمیم

    این تکنیک تعمیم‌پذیری قدرتمندی را نشان می‌دهد که به شخصیت‌ها اجازه می‌دهد اقدامات جدیدی را در موقعیت‌هایی که قبلاً با آن‌ها روبرو نشده‌اند، مانند پریدن از روی چندین ستون دیده نشده، انجام دهند.

  • درون‌یابی حالت (پوز)

    کاربران می‌توانند دو یا چند حالت هدف را مشخص کنند و این روش به طور یکپارچه انتقال حرکت بین آن‌ها را تولید می‌کند، قابلیتی که اغلب در سایر تکنیک‌های هوش مصنوعی مبتنی بر انتشار (diffusion) وجود ندارد.

  • مقاومت در برابر اختلالات

    شخصیت‌های متحرک مقاومت قابل توجهی در برابر اختلالات و اغتشاشات خارجی از خود نشان می‌دهند و حرکت مورد نظر خود را با وجود تداخل حفظ می‌کنند.

  • سازوکار یادگیری زیربنایی

    هوش مصنوعی یاد می‌گیرد که حرکات ورودی نامربوط را به هم ببافد و آن‌ها را در موقعیت‌های جدید به کار گیرد، و به جای صرفاً دنبال کردن یک رقص‌آرایی از پیش تعریف شده، حرکات آینده را پیش‌بینی می‌کند.

  • کارایی آموزش

    مدل را می‌توان در یک GPU تنها در عرض 24 ساعت آموزش داد که آن را بسیار در دسترس و آسان برای استقرار می‌کند.

  • قابلیت‌ها و کاربردهای Zero-Shot

    این مدل با یادگیری Zero-Shot کار می‌کند، نیازی به آموزش مجدد یا تنظیمات خاص وظیفه ندارد و پتانسیل قابل توجهی برای ایجاد شخصیت‌های بازی، آواتارهای VR و ربات‌هایی با حرکت طبیعی دارد.

این هوش مصنوعی جدید مانند آموزش دادن به یک رقصنده است، نه فقط گام‌ها را، بلکه نحوه حس کردن ریتم را چند ثانیه جلوتر – به طوری که هر حرکت از قبل پیش‌بینی می‌کند چه چیزی در ادامه می‌آید.

زیر جزئیات

ویژگیتوضیحات
حرکت قابل کنترل و واقع‌گرایانهحرکت بسیار قابل کنترل و قابل قبول از نظر فیزیکی را از داده‌های متنوع موشن‌کپچر تولید می‌کند و بر معاوضه‌های سنتی غلبه می‌کند.
اجتناب از موانع ثابتشخصیت‌ها را قادر می‌سازد تا به طور خودکار در اطراف اشیاء ثابت مانند دیوارها حرکت کنند.
اجتناب از موانع پویابه شخصیت‌ها اجازه می‌دهد تا از برخورد با سایر موجودیت‌های متحرک تحت کنترل هوش مصنوعی در محیط‌های پویا جلوگیری کنند.
توالی‌های انیمیشن طولانی‌ترتوالی‌های انیمیشن طولانی و پیوسته را به طور کارآمد مدیریت و تولید می‌کند.
تعمیم به سناریوهای دیده نشدهتوانایی انجام اقدامات جدید در موقعیت‌هایی که در طول آموزش با آن‌ها روبرو نشده است، مانند پریدن از روی چندین ستون، را نشان می‌دهد.
درون‌یابی حالت (پوز)انتقال حرکت روان و طبیعی بین دو یا چند حالت مشخص شده را تولید می‌کند، قابلیتی منحصر به فرد برای روش‌های مبتنی بر انتشار (diffusion).
مقاومت در برابر اختلالاتشخصیت‌ها حتی در صورت قرار گرفتن در معرض اختلالات فیزیکی خارجی، حرکت و ثبات خود را حفظ می‌کنند.
آموزش کارآمدمدل را می‌توان به سرعت آموزش داد و تنها به یک GPU به مدت 24 ساعت نیاز دارد.
یادگیری Zero-Shotبدون نیاز به آموزش مجدد یا تنظیمات خاص وظیفه عمل می‌کند و برای کاربردهایی مانند شخصیت‌های بازی یا آواتارهای VR، بدون نیاز به تنظیمات اولیه، با سناریوهای مختلف سازگار می‌شود.

تگ ها

هوش
انیمیشن
پیشرفت
دیفیوزکلاک
مولد
اشتراک گذاری