15 آبا 1404
نمایشهای چشمگیر رباتها معمولاً در محیطهای کنترلشده صورت میگیرد و با وظایف پیچیده، نامنظم و جدید دنیای واقعی مشکل دارند که نشاندهنده یک شکاف قابل توجه بین شبیهسازی و واقعیت (sim-to-real gap) است. یک هوش مصنوعی جدید به نام NeRD (دینامیک عصبی ربات)، رباتها را قادر میسازد تا فیزیک را در شبیهسازی یاد بگیرند و به طور مؤثر به واقعیت تعمیم دهند، حتی از شبیهسازهای فیزیک سنتی نیز بهتر عمل میکند.

بسیاری از حرکات آکروباتیک، پارکور، پشتکزدن و رقصهای چشمگیر رباتها در محیطهای کنترلشده نمایش داده میشوند که در آنها هر قدم از قبل مشخص است و اینها را به 'مسائل آسان' تبدیل میکند. چالشهای واقعاً دشوار شامل جابجایی و گرفتن اشیاء کوچک، تغییرشکلپذیر یا جدید روی سطوح جدید و زیر نور ناآشنا است که نیازمند سازگاری رباتها با موقعیتهای جدید یا در حال تغییر است.
دانشمندان معمولاً ربات را ابتدا در یک شبیهسازی آموزش میدهند و سپس آن را در دنیای واقعی به کار میگیرند، درست مانند یادگیری در یک بازی ویدیویی. با این حال، چیزهایی که در شبیهسازی بسیار خوب کار میکنند، اغلب در واقعیت به شدت دچار مشکل میشوند و خراب میشوند که نشاندهنده یک شکاف قابل توجه 'شبیهسازی به واقعیت' است.
یک کار جدید باورنکردنی، NeRD را معرفی میکند؛ یک سیستم دینامیک عصبی ربات که به دنبال حل دو مشکل دشوار است: انجام پیشبینیها در هزاران مرحله شبیهسازی و تعمیمپذیری در وظایف، محیطها و ریختشناسیهای مختلف ربات.
شبیهسازهای فیزیک مرجع، مبتنی بر معادلات دستنویس، فوقالعاده دقیق و قابل اعتماد هستند، اما به طرز دردناکی کند و شکننده عمل میکنند. اینها در صورت تغییر شکل یا محیط ربات، نیازمند تنظیم مجدد دستی بخشهای بزرگی از تنظیمات هستند.
دانشمندان یک هوش مصنوعی به نام NeRD نوشتند که به مقدار زیادی فیلم از شبیهسازهای فیزیک نگاه میکند و نحوه کار جهان را فریم به فریم مطالعه میکند. این هوش مصنوعی نمونههای کافی از رفتار فیزیکی را یاد میگیرد تا از معادلات صرفنظر کرده و آنچه را که بعداً اتفاق میافتد پیشبینی کند، و به عنوان یک حلکننده فیزیک عصبی عمل میکند.
NeRD به طور کامل وظایف کلاسیک مانند تعادل میله چرخدار (cartpole) را انجام میدهد و رفتار آونگ را با دقت پیشبینی میکند، و شباهت زیادی به شبیهسازی واقعی دارد. یک ربات یاد گرفت در تخیل NeRD راه برود و سپس هنگام قرار گرفتن در بازی، رفتاری بسیار مشابه از خود نشان میدهد، بدون نیاز به آموزش مجدد یا تنظیم دقیق.
یک کنترلکننده که در تخیل NeRD آموزش دیده است، میتواند یک ربات را به طور مؤثر حرکت دهد و قابلیت خود را با بازوهای رباتیک پیچیده نشان دهد. هنگامی که در واقعیت برای لمس نقاط قرمز خاص قرار میگیرد، ربات NeRD نه تنها کار میکند بلکه آن را آسان جلوه میدهد، وظیفهای که معمولاً در آزمایشگاههای دنیای واقعی بسیار چالشبرانگیز است.
NeRD یاد میگیرد تغییر بعدی در حالت ربات را با اعمال حرکت در چارچوب مختصات خود ربات و سپس تبدیل آن به مختصات جهانی پیشبینی کند، مشابه یادگیری حرکت در یک اتاق تاریک. هنگامی که روی دادههای پرتاب مکعب در دنیای واقعی تنظیم دقیق شد، NeRD بهتر و سریعتر از شبیهساز فیزیک (Warp) که دادهها را ایجاد کرده بود، عمل کرد، به این معنی که 'شاگرد از استاد پیشی گرفت' با داشتن 'هوش خیابانی' به جای فقط 'هوش کتابی'.
NeRD هنوز کامل نیست و بر روی رباتهای بسیار پیچیده مانند انساننماها آزمایش نشده است.
NeRD عملکرد بهتری نسبت به شبیهساز فیزیک Warp که ابتدا آن را ایجاد کرده بود، نشان داد؛ با این حساب، شاگرد از استاد پیشی گرفت و سریعتر نیز بود.
| aspect | traditional_robot_demos | traditional_physics_simulators | nerd_approach |
|---|---|---|---|
| نوع مشکل مورد بررسی | آسان (آکروباتیک، توالیهای شناخته شده، محیطهای کنترلشده) | تلاش برای حل مسائل دشوار، اما مشکل با پیچیدگیهای دنیای واقعی | حل مسائل دشوار، روزمره و پیچیده (تعمیمپذیری در وظایف/محیطها) |
| سازگاری و تعمیمپذیری | کم (اغلب کدنویسی دستی، بدون سازگاری با موقعیتهای جدید) | شکننده (نیازمند تنظیم مجدد دستی برای تغییرات در ربات/محیط) | بالا (تعمیمپذیری در وظایف، محیطها و ریختشناسیهای ربات) |
| سرعت پیشبینی | قابل اجرا نیست (تمرکز بر اجرا، نه پیشبینی) | به طرز دردناکی کند | سریعتر از شبیهسازهای فیزیک سنتی |
| وفاداری/دقت | جلوه بصری چشمگیر، اما نماینده چالشهای واقعی نیست | فوقالعاده دقیق در شرایط ایدهآل | بالا، با دقت زیاد مطابقت دارد و میتواند در دادههای دنیای واقعی از شبیهسازهای سنتی بهتر عمل کند |
| شکاف شبیهسازی به واقعیت | با تنظیمات کنترلشده و شناختهشده به حداقل میرسد | مسئله اصلی؛ چیزها در واقعیت 'دیوانهوار خراب میشوند' | به طور مؤثری این شکاف را پر میکند و امکان استقرار روان در دنیای واقعی را فراهم میآورد |
| مکانیزم زیربنایی | اغلب کدنویسی دستی یا الگوریتمهای کنترل خاص | معادلات فیزیک دستنویس | حلکننده فیزیک عصبی دینامیک را از دادهها یاد میگیرد، تغییرات حالت را پیشبینی میکند (چارچوب مختصات ربات) |
