NeRD: آموزش رویاپردازی به ربات‌ها برای تعمیم‌پذیری در دنیای واقعی

نمایش‌های چشمگیر ربات‌ها معمولاً در محیط‌های کنترل‌شده صورت می‌گیرد و با وظایف پیچیده، نامنظم و جدید دنیای واقعی مشکل دارند که نشان‌دهنده یک شکاف قابل توجه بین شبیه‌سازی و واقعیت (sim-to-real gap) است. یک هوش مصنوعی جدید به نام NeRD (دینامیک عصبی ربات)، ربات‌ها را قادر می‌سازد تا فیزیک را در شبیه‌سازی یاد بگیرند و به طور مؤثر به واقعیت تعمیم دهند، حتی از شبیه‌سازهای فیزیک سنتی نیز بهتر عمل می‌کند.

image

خلاصه نکات کلیدی

  • قابلیت‌ها و محدودیت‌های فعلی ربات‌ها

    بسیاری از حرکات آکروباتیک، پارکور، پشتک‌زدن و رقص‌های چشمگیر ربات‌ها در محیط‌های کنترل‌شده نمایش داده می‌شوند که در آن‌ها هر قدم از قبل مشخص است و این‌ها را به 'مسائل آسان' تبدیل می‌کند. چالش‌های واقعاً دشوار شامل جابجایی و گرفتن اشیاء کوچک، تغییرشکل‌پذیر یا جدید روی سطوح جدید و زیر نور ناآشنا است که نیازمند سازگاری ربات‌ها با موقعیت‌های جدید یا در حال تغییر است.

  • روش آموزش سنتی ربات‌ها

    دانشمندان معمولاً ربات را ابتدا در یک شبیه‌سازی آموزش می‌دهند و سپس آن را در دنیای واقعی به کار می‌گیرند، درست مانند یادگیری در یک بازی ویدیویی. با این حال، چیزهایی که در شبیه‌سازی بسیار خوب کار می‌کنند، اغلب در واقعیت به شدت دچار مشکل می‌شوند و خراب می‌شوند که نشان‌دهنده یک شکاف قابل توجه 'شبیه‌سازی به واقعیت' است.

  • معرفی NeRD (دینامیک عصبی ربات)

    یک کار جدید باورنکردنی، NeRD را معرفی می‌کند؛ یک سیستم دینامیک عصبی ربات که به دنبال حل دو مشکل دشوار است: انجام پیش‌بینی‌ها در هزاران مرحله شبیه‌سازی و تعمیم‌پذیری در وظایف، محیط‌ها و ریخت‌شناسی‌های مختلف ربات.

  • چالش‌ها با شبیه‌سازهای فیزیک سنتی

    شبیه‌سازهای فیزیک مرجع، مبتنی بر معادلات دست‌نویس، فوق‌العاده دقیق و قابل اعتماد هستند، اما به طرز دردناکی کند و شکننده عمل می‌کنند. این‌ها در صورت تغییر شکل یا محیط ربات، نیازمند تنظیم مجدد دستی بخش‌های بزرگی از تنظیمات هستند.

  • نحوه عملکرد NeRD به عنوان حل‌کننده فیزیک عصبی

    دانشمندان یک هوش مصنوعی به نام NeRD نوشتند که به مقدار زیادی فیلم از شبیه‌سازهای فیزیک نگاه می‌کند و نحوه کار جهان را فریم به فریم مطالعه می‌کند. این هوش مصنوعی نمونه‌های کافی از رفتار فیزیکی را یاد می‌گیرد تا از معادلات صرف‌نظر کرده و آنچه را که بعداً اتفاق می‌افتد پیش‌بینی کند، و به عنوان یک حل‌کننده فیزیک عصبی عمل می‌کند.

  • عملکرد و تعمیم‌پذیری NeRD

    NeRD به طور کامل وظایف کلاسیک مانند تعادل میله چرخ‌دار (cartpole) را انجام می‌دهد و رفتار آونگ را با دقت پیش‌بینی می‌کند، و شباهت زیادی به شبیه‌سازی واقعی دارد. یک ربات یاد گرفت در تخیل NeRD راه برود و سپس هنگام قرار گرفتن در بازی، رفتاری بسیار مشابه از خود نشان می‌دهد، بدون نیاز به آموزش مجدد یا تنظیم دقیق.

  • کاربرد و برتری در دنیای واقعی

    یک کنترل‌کننده که در تخیل NeRD آموزش دیده است، می‌تواند یک ربات را به طور مؤثر حرکت دهد و قابلیت خود را با بازوهای رباتیک پیچیده نشان دهد. هنگامی که در واقعیت برای لمس نقاط قرمز خاص قرار می‌گیرد، ربات NeRD نه تنها کار می‌کند بلکه آن را آسان جلوه می‌دهد، وظیفه‌ای که معمولاً در آزمایشگاه‌های دنیای واقعی بسیار چالش‌برانگیز است.

  • مکانیزم یادگیری و 'هوش خیابانی' NeRD

    NeRD یاد می‌گیرد تغییر بعدی در حالت ربات را با اعمال حرکت در چارچوب مختصات خود ربات و سپس تبدیل آن به مختصات جهانی پیش‌بینی کند، مشابه یادگیری حرکت در یک اتاق تاریک. هنگامی که روی داده‌های پرتاب مکعب در دنیای واقعی تنظیم دقیق شد، NeRD بهتر و سریع‌تر از شبیه‌ساز فیزیک (Warp) که داده‌ها را ایجاد کرده بود، عمل کرد، به این معنی که 'شاگرد از استاد پیشی گرفت' با داشتن 'هوش خیابانی' به جای فقط 'هوش کتابی'.

  • محدودیت‌های فعلی NeRD

    NeRD هنوز کامل نیست و بر روی ربات‌های بسیار پیچیده مانند انسان‌نماها آزمایش نشده است.

NeRD عملکرد بهتری نسبت به شبیه‌ساز فیزیک Warp که ابتدا آن را ایجاد کرده بود، نشان داد؛ با این حساب، شاگرد از استاد پیشی گرفت و سریع‌تر نیز بود.

زیر جزئیات

aspecttraditional_robot_demostraditional_physics_simulatorsnerd_approach
نوع مشکل مورد بررسیآسان (آکروباتیک، توالی‌های شناخته شده، محیط‌های کنترل‌شده)تلاش برای حل مسائل دشوار، اما مشکل با پیچیدگی‌های دنیای واقعیحل مسائل دشوار، روزمره و پیچیده (تعمیم‌پذیری در وظایف/محیط‌ها)
سازگاری و تعمیم‌پذیریکم (اغلب کدنویسی دستی، بدون سازگاری با موقعیت‌های جدید)شکننده (نیازمند تنظیم مجدد دستی برای تغییرات در ربات/محیط)بالا (تعمیم‌پذیری در وظایف، محیط‌ها و ریخت‌شناسی‌های ربات)
سرعت پیش‌بینیقابل اجرا نیست (تمرکز بر اجرا، نه پیش‌بینی)به طرز دردناکی کندسریع‌تر از شبیه‌سازهای فیزیک سنتی
وفاداری/دقتجلوه‌ بصری چشمگیر، اما نماینده چالش‌های واقعی نیستفوق‌العاده دقیق در شرایط ایده‌آلبالا، با دقت زیاد مطابقت دارد و می‌تواند در داده‌های دنیای واقعی از شبیه‌سازهای سنتی بهتر عمل کند
شکاف شبیه‌سازی به واقعیتبا تنظیمات کنترل‌شده و شناخته‌شده به حداقل می‌رسدمسئله اصلی؛ چیزها در واقعیت 'دیوانه‌وار خراب می‌شوند'به طور مؤثری این شکاف را پر می‌کند و امکان استقرار روان در دنیای واقعی را فراهم می‌آورد
مکانیزم زیربناییاغلب کدنویسی دستی یا الگوریتم‌های کنترل خاصمعادلات فیزیک دست‌نویسحل‌کننده فیزیک عصبی دینامیک را از داده‌ها یاد می‌گیرد، تغییرات حالت را پیش‌بینی می‌کند (چارچوب مختصات ربات)

تگ ها

رباتیک
هوش‌مصنوعی
پیشرفت
NeRD
شبیه‌سازی
اشتراک گذاری