TL;DR
- v1 نوع اعلام:.
- جدید چکیده:.
- مدلهای رانندگی خودکار سرتاسر مبتنی بر معماریهای Vision-Language-Action (VLA) نتایج امیدوارکنندهای را با یادگیری سیاستهای رانندگی از طریق.
چه اتفاقی افتاد
v1 نوع اعلام:. جدید چکیده:.
مدلهای رانندگی خودکار سرتاسر مبتنی بر معماریهای Vision-Language-Action (VLA) نتایج امیدوارکنندهای را با یادگیری سیاستهای رانندگی از طریق. شبیهسازی رفتار بر روی نمایشهای متخصص نشان دادهاند.
با این حال،. یادگیری تقلیدی ذاتاً مدل را به تکرار رفتارهای مشاهده شده بدون کاوش در استراتژیهای مختلف رانندگی محدود میکند.
و آن را در سناریوهای جدید یا خارج از توزیع شکننده میکند. یادگیری تقویتی (RL) با فعال کردن اکتشاف سیاست فراتر از توزیع متخصص، یک درمان طبیعی ارائه میدهد.
با این حال،. مدلهای VLA،.
که معمولاً بر روی مجموعههای داده آفلاین آموزش داده میشوند،. فاقد انتقال حالت مستقیم قابل مشاهده هستند،.
که نیاز به یک مدل دنیای آموختهشده برای پیشبینی پیامدهای اقدام دارد. در این کار،.
ما یک چارچوب یکپارچه درک و تولید را پیشنهاد میکنیم که از مدلسازی جهان برای فعال کردن همزمان. کاوش معنادار و ارائه متراکم استفاده میکند.
نظارت بهطور خاص،. ما پیشبینی مسیر را با RGB آینده و تولید تصویر عمقی بهعنوان اهداف مدلسازی متراکم جهان تقویت میکنیم،.
و مدل را ملزم میکنیم که نمایشهای بصری و هندسی دقیقی را بیاموزد که بهطور قابلتوجهی ستون فقرات. برنامهریزی را غنی میکند.
فراتر از خدمت بهعنوان یک سیگنال نظارتی،. مدل جهانی بیشتر بهعنوان منبع پاداش ذاتی برای کاوش سیاست عمل میکند:.
عدم قطعیت پیش بینی تصویر آن بهطور طبیعی تازگی یک مسیر را نسبت به توزیع آموزش اندازهگیری. میکند،.
جایی که عدم قطعیت بالا نشان دهنده سناریوهای خارج از توزیع است که اگر امن باشد،. فرصتهای یادگیری ارزشمند را نشان میدهد.
ما این سیگنال اکتشافی را در یک پاداش دارای دروازه ایمنی وارد میکنیم و خط مشی را. از طریق بهینهسازی خط مشی نسبی گروهی (GRPO) بهینه میکنیم.
آزمایشها روی بنچمارکهای NAVSIM و nuScenes اثربخشی رویکرد ما را نشان میدهند و به یک امتیاز پیشرفته PDMS. دست مییابیم.
از 93. 7 و EPDMS 88.
8 در NAVSIM. کد و نسخه نمایشی به صورت عمومیدر https: //zihaosheng.
github. io/ExploreVLA/ در دسترس خواهد بود.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
