24 مهر 1404
میدانهای عصبی نویدبخش تولید دنیاهای سهبعدی قابل کاوش از حداقل عکسها هستند، اما اغلب با چالشهایی مانند نتایج تار و مصنوعات شناور به دلیل مشکلات آموزشی مواجه میشوند. تکنیکهای جدید با معرفی تغییرات ساده در طول آموزش و امکان حرکت پیچیده بلادرنگ در این صحنههای تولیدشده، این محدودیتها را برطرف میکنند.

میدانهای عصبی پتانسیل تولید دنیاهای سهبعدی کامل و قابل کاوش را تنها با چند عکس ارائه میدهند که برای کاربردهایی مانند بازیهای ویدیویی و آموزش خودروهای خودران بسیار مفید است.
فرآیند آموزش میدانهای عصبی مکرراً با مشکلاتی مواجه میشود که منجر به نتایج نامطلوب مانند نتایج تار، سطوح ناهموار یا مصنوعات 'شناور' در صحنههای سهبعدی بازسازیشده میشود.
یک تکنیک هوشمندانه و ساده شامل افزودن نویز در طول آموزش میدان عصبی است که سپس به تدریج محو میشود و منجر به بازسازیهای سهبعدی بهطور قابل توجهی واضحتر و حذف مصنوعات شناور مزاحم میشود. این روش اثربخشی خود را تقریباً در هر نوع میدان عصبی نشان میدهد.
روشهای قبلی بازسازی سهبعدی برای اشیائی مانند آرمادیلو یا خرگوش اغلب مصنوعات شناور اضافی تولید میکردند، در حالی که روش جدید تزریق نویز به سرعت تثبیت میشود تا نتایجی بدون مشکل ایجاد کند. همچنین به طور موثر از 'مصنوعات فاجعهبار' مشاهده شده در بازسازیهای قبلی هندسههای پیچیده، مانند قلعه سیبنیک، جلوگیری میکند و اطمینان میدهد که قسمتهای صاف واقعاً صاف هستند.
یک پیشرفت تحقیقاتی جداگانه از Gaussian Splats برای رندر صحنههای متحرک استفاده میکند و امکان حرکتهای پیچیده مانند راه رفتن افراد یا تکان دادن دم را برای انیمیشن بلادرنگ با کیفیت بالاتر فراهم میسازد. این امر با قادر ساختن تودههای Gaussian منفرد که صحنه را تشکیل میدهند، برای حرکت مستقل بر اساس اسکریپتهای انیمیشن خودشان به دست میآید.
تکنیک حرکت Gaussian Splats به بیش از ۴۵۰ فریم بر ثانیه دست مییابد که تا هفت برابر سریعتر از روشهای قبلی عمل میکند و در عین حال کیفیت را حفظ یا بهبود میبخشد. این کارایی ناشی از رویکرد آن در حرکت دادن اجزای صحنه به صورت جداگانه به جای تغییر کل صحنه برای شبیهسازی حرکت است.
این پیشرفتها در میدانهای عصبی هم برای تولید صحنه ثابت و هم برای حرکت بلادرنگ، آیندهای را نزدیکتر میکنند که در آن دنیاهای مجازی بلادرنگ برای همه، نه فقط استودیوهای فیلمسازی، قابل دسترس باشند و مجازیسازی سهبعدی فوری از فیلمهای دنیای واقعی را امکانپذیر سازند، مانند فیلمبرداری از یک سگ و سپس راه رفتن با آن در یک دنیای سهبعدی مجازی شگفتانگیز.
دنیاهای مجازی بلادرنگ نه تنها برای استودیوهای فیلمسازی، بلکه برای همه در دسترس هستند.
| جنبه | مشکل مورد بررسی | راهحل/تکنیک | مزیت/نتیجه |
|---|---|---|---|
| بازسازی سهبعدی میدان عصبی | نتایج تار، سطوح ناهموار و مصنوعات شناور در صحنههای سهبعدی تولیدشده. | افزودن نویز در طول آموزش شبکه عصبی، که با گذشت زمان محو میشود. | بازسازیهای سهبعدی به طور قابل توجهی واضحتر و تمیزتر؛ حذف مصنوعات؛ قابل اجرا برای انواع مختلف میدانهای عصبی. |
| حرکت بلادرنگ در صحنههای سهبعدی | دشواری در رندر حرکتهای پیچیده به صورت بلادرنگ با کیفیت بالا با استفاده از روشهای قبلی. | استفاده از Gaussian Splats، که در آن اجزای صحنه (تودهها) به صورت مستقل متحرک میشوند. | حرکتهای پیچیده به صورت بلادرنگ با کیفیت بالاتر رندر میشوند؛ تا ۷ برابر سریعتر از تکنیکهای قبلی؛ بینندگان تعاملی را امکانپذیر میسازد. |
