24 مهر 1404
یک تکنیک نوین سنتز صدا با تحلیل اشیاء در صحنههای بصری و شبیهسازی امواج فشار در نمایشهای وکسلبندیشده، صداهای واقعی تولید میکند. این روش محیطهای صوتی پویا و دقیق از نظر فیزیکی را بدون اتکا به نمونههای از پیش ضبطشده یا هوش مصنوعی ایجاد میکند.

یک تکنیک نوین سنتز صدا قادر است اشیاء را در یک صحنه تحلیل کرده و متعاقباً صداهای مرتبط با آنها را بدون نیاز به صدای از پیش ضبطشده یا هوش مصنوعی تولید کند.
شبیهسازی کامپیوتری صداهای تولیدشده توسط این تکنیک به طرز قابل توجهی واقعگرایانه است و اغلب از صدای واقعی قابل تشخیص نیست، که در ابتدا باعث ناباوری در مورد منشاء دیجیتال آن میشود.
این تکنیک با تجزیه اشیاء به «وکسل» (قطعات حجمی کوچک) و سپس شبیهسازی رفتار امواج فشار در حین تعامل و انتشار در این نمایشهای وکسلبندیشده، صدا ایجاد میکند.
این روش هوا را بین نمایشهای وکسلبندیشده اشیاء در حین حرکت یا تغییر شکل، بهطور یکپارچه تغییر شکل میدهد، که امکان بهروزرسانی روان صدا را بدون بریدگی یا پاپ قابل شنیدن فراهم میکند، شبیه به دیجی که آهنگها را ترکیب میکند.
حلکننده (solver) ذاتاً خواص آکوستیک فضایی را که صداها در آن رخ میدهند، درک میکند و بهطور خودکار، مثلاً تفاوت صدای پاشش آب نزدیک دیوار را از صدای پاشش آب در یک فضای باز تشخیص میدهد و تجربیات شنیداری دقیق از نظر فیزیکی ایجاد میکند.
این تکنیک نیاز به قرار دادن دستی جلوههای صوتی در بازیها و فیلمها را از بین میبرد، زیرا موتور فیزیک (physics engine) بهطور خودکار صدای مورد نیاز را تولید کرده و زمان توسعه قابل توجهی را صرفهجویی میکند.
این سیستم هندسه را بهطور دقیق در نظر میگیرد، که با نحوه تولید صدای خفه توسط یک منبع صوتی محصور شده توسط دستها نشان داده میشود و دقیقاً میرایی آکوستیک فیزیکی دنیای واقعی را منعکس میکند.
یک حلکننده یکپارچه واحد، تعاملات صوتی متنوعی از جمله صداهای از پیش ضبطشده، پوستههای لرزان، مایعات در حال حرکت و اشیاء سختی مانند لگو را ادغام میکند و نیاز به الگوریتمهای تخصصی متعدد را از بین میبرد.
این تکنیک از شبکههای یکنواخت استفاده میکند که آن را بسیار مناسب GPU میسازد و بهبودهای قابل توجهی در سرعت را ممکن میکند، با افزایشهای معمول ۱۴۰ برابری و تا ۱۰۰۰ برابر سریعتر از حلکنندههای سنتی CPU چند هستهای.
برخی شبیهسازیها، حتی در رزولوشنهای پایین، سریعتر از بلادرنگ (real-time) اجرا میشوند، که نشاندهنده یک گام مهم به سمت شبیهسازیهای صوتی تعاملی در کاربردهای مختلف است.
درونیابی روان بین فریمهای انیمیشن حاصل میشود، که از آرتیفکتهای «پاپ» رایج در روشهای قبلی جلوگیری کرده و یک تجربه شنیداری یکپارچه را تضمین میکند.
این سیستم به صورت قوی تحولات هندسی شدید، مانند باز و بسته شدن حفرهها را بدون بیثباتی عددی (numerical instability) مدیریت میکند.
این تکنیک قادر به شبیهسازی بیش از ۳۰۰,۰۰۰ صدای همزمان برخورد آبنبات است، اگرچه هنوز بلادرنگ (real-time) نیست و تقریباً ۱۵ ثانیه برای محاسبه ۱ ثانیه صدا نیاز دارد.
این تکنیک، چالش هوای تازه ظاهر شده پس از حرکت اشیاء را با حل جهانی میدانهای فشار و سرعت از دست رفته با استفاده از روش حداقل مربعات (least-squares method) حل میکند و پایداری شبیهسازی را حفظ میکند.
این روش از منابع صوتی کوچک نقطهمانند برای عناصر دقیق مانند آوار یا پاششها پشتیبانی میکند و نیاز به شبکههای فوقالعاده ظریف را برای ثبت رویدادهای صوتی ظریف کاهش میدهد.
این سیستم امکان ادغام هندسه «فانتوم» (ساختارهای ریاضی، نه اشیاء فیزیکی) را برای شکلدهی و سفارشیسازی خروجی صدا فراهم کرده و قابلیتهای پیشرفته طراحی صدا را ارائه میدهد.
برای اشیاء متحرک، شرایط مرزی (boundary conditions) بهطور هوشمندانه بازنشانی میشوند، که از پاپهای ناگهانی صدا هنگام ورود یک شیء به منطقه پر سر و صدا جلوگیری کرده و باورپذیری فیزیکی را تضمین میکند.
این تکنیک در حال نزدیک شدن به سنتز صدای تعاملی بلادرنگ (real-time) است و آیندهای را متصور میشود که در آن VR، بازیها و شبیهسازیها به جای صدای ایستا و از پیش ضبطشده، دارای صحنههای صوتی پویا و محاسبهشده بر اساس فیزیک باشند و بر آیندهای تأکید میکند که در آن صدا محاسبه میشود، نه ضبط.
کد و مجموعه داده برای این کار پیشگامانه به صورت رایگان برای عموم در دسترس هستند.
آینده صدا ضبط نمیشود - بلکه محاسبه میشود، و قرار است فوقالعاده باشد.
| ویژگی | توضیح |
|---|---|
| حلکننده یکپارچه | تعاملات صوتی مختلف (مانند مایعات، پوستههای لرزان، اجسام صلب) را در یک الگوریتم واحد و جامع ادغام میکند. |
| شتابدهی GPU | با اجرای کارآمد بر روی شبکههای یکنواخت و یک GPU واحد، سرعتهای قابل توجهی (۱۴۰ تا ۱۰۰۰ برابر سریعتر از CPUها) را به دست میآورد. |
| قابلیت بلادرنگ | برخی نمایشها قبلاً سریعتر از بلادرنگ (real-time) اجرا میشوند و راه را برای شبیهسازیهای صوتی تعاملی هموار میکنند. |
| انتقال روان صدا | از درونیابی روان بین فریمهای انیمیشن برای حذف آرتیفکتهای «پاپ» هنگام حرکت و تغییر شکل اشیاء استفاده میکند. |
| صدای آگاه به هندسه | بهطور دقیق هندسه پیچیده و آکوستیک محیطی را در نظر میگیرد و صداهایی تولید میکند که واقعیت فیزیکی را منعکس میکنند (مانند صداهای خفه در فضاهای بسته). |
| مناظر صوتی مبتنی بر فیزیک | صدای پویا و باورپذیری را کاملاً از شبیهسازیهای فیزیک تولید میکند و اتکا به صدای از پیش ضبطشده و AI را از بین میبرد. |
