24 مهر 1404
ایجاد دنیاهای مجازی واقعاً فراگیر و تعاملی، با وجود پیشرفتها در هوش مصنوعی، با چالشهای مهمی در رندرینگ، پر کردن آنها با اشیا و تولید آواتارهای انسانی واقعگرایانه روبروست. با این حال، تحقیقات اخیر هوش مصنوعی راهحلهای نوآورانهای برای رندرینگ کارآمد محیطهای دقیق، بازسازی صحنههای پیچیده سهبعدی از تصاویر تکی و ثبت حرکات بسیار واقعگرایانه صورت و بدن انسان ارائه میدهد.

ایجاد دنیاهای مجازی کارآمد و تعاملی که در آن افراد بتوانند با هم ارتباط برقرار کرده و بازی کنند، به دلیل دشواریها در رندرینگ محیطهای واقعگرایانه، پر کردن آنها با اشیا و تولید آواتارهای انسانی متقاعدکننده، هنوز ممکن نیست.
تکنیکهای موجود مانند NERFs و Gaussian splatting برای یادگیری کل صحنهها از دادههای تصویری ناقص مشکل دارند که منجر به نویز قابل توجه و مصنوعات بصری هنگام رندرینگ از زوایای دیده نشده میشود.
یک تکنیک جدید هوش مصنوعی با یادگیری پاکسازی خروجیهای اولیه ناقص، رندرینگ دنیای مجازی را به طور قابل توجهی بهبود میبخشد و نتایج غیرقابل استفاده را به نمایشهای بصری تقریباً بینقص تبدیل میکند.
روشهای قبلی برای بازسازی اطلاعات سهبعدی دقیق از عکسها یا فیلمها، به ویژه برای کل صحنهها، ناکافی بودند و اغلب منجر به نمایشهای خشن، تراز نادرست اشیا و مقیاسبندی غیردقیق میشدند.
یک تکنیک نوین هوش مصنوعی امکان ایجاد نسخههای دیجیتالی سهبعدی دقیق از کل صحنهها را تنها از یک تصویر فراهم میکند، با بازسازی دقیق مقیاسها و اطمینان از تراز صحیح اشیا بدون تداخل.
این پیشرفت شامل یک مدل هوش مصنوعی شبیه GPT برای درک روابط پیچیده بین اشیا است و یک مرحله تصحیح الهامگرفته از فیزیک را برای اطمینان از واقعگرایی فیزیکی، حل مسائلی مانند عناصر شناور یا تداخلی، ادغام میکند.
تولید انسانهای دیجیتالی واقعگرایانه به طور استثنایی دشوار است، زیرا درک انسان نسبت به عدم دقتهای ظریف در صورت و ژستها بسیار حساس است که اغلب باعث میشود آواتارهای دیجیتالی غیرمتقاعدکننده به نظر برسند و اثر 'دره وهمآور' را ایجاد کند.
یک تکنیک جدید از گاوسیانهای تغییرشکلپذیر که هوشمندانه به هندسه صورت متصل شدهاند، برای ثبت حرکت صورت بسیار دقیق و ژستهای قوی، حتی با وضوح 4K، استفاده میکند و واقعگرایی آواتار انسانی را به طور قابل توجهی بهبود میبخشد.
اگرچه هنوز کامل نیست و برخی جزئیات از دست رفته و لرزشهای جزئی در حرکات چشم و دندان وجود دارد، پیشرفت سریع نشان میدهد که دنیاهای مجازی تقریباً بینقص و آواتارهای واقعگرایانه به سرعت در حال تبدیل شدن به واقعیت هستند.
دنیاهای مجازی تقریباً بینقص در حال ساخت هستند و پیشرفتهای باورنکردنی در این زمینه وجود دارد.
| چالش | محدودیت قبلی | راهحل هوش مصنوعی | نوآوری کلیدی |
|---|---|---|---|
| رندرینگ کارآمد دنیاهای مجازی واقعگرایانه از دادههای محدود. | NERFs و Gaussian splatting با اطلاعات ورودی ناکافی، نویز و مصنوعات ایجاد میکردند. | یک تکنیک هوش مصنوعی که برای پاکسازی رندرینگهای اولیه ناقص آموزش دیده است. | یک فرآیند اصلاحی که دستیابی به کیفیت بصری تقریباً بینقص را از خروجیهای ناقص ساده میکند. |
| بازسازی صحنههای سهبعدی دقیق از ورودی محدود، مانند یک تصویر واحد. | روشهای موجود نتایج سهبعدی خشن (غیردقیق) با تراز ضعیف اشیا و مقیاسهای نادرست برای کل صحنهها تولید میکردند. | یک تکنیک جدید هوش مصنوعی یک مدل صحنه سهبعدی جامع را تنها از یک تصویر ایجاد میکند و از مقیاسها و تراز صحیح اطمینان میدهد. | ادغام یک مدل شبیه GPT برای درک روابط اشیا همراه با یک مرحله تصحیح الهامگرفته از فیزیک برای واقعگرایی. |
| ایجاد آواتارهای انسانی دیجیتالی متقاعدکننده که از 'دره وهمآور' اجتناب کنند. | تکنیکهای قبلی به دلیل حساسیت به عدم دقتهای کوچک، نمایشهای دیجیتالی انسانها را غیرمتقاعدکننده و 'ناجور' تولید میکردند. | یک تکنیک جدید با استفاده از گاوسیانهای تغییرشکلپذیر، حرکت دقیق صورت و بدن را تا وضوح 4K ثبت میکند. | اتصال مستقیم عناصر گاوسیان تغییرشکلپذیر به هندسه صورت برای ثبت دقیق حالات و ژستهای با وضوح بالا. |
