TL;DR
- چکیده: مدلهای زبان بینایی (VLM) اخیراً قابلیتهای قوی در نگاشت مشاهدات چندوجهی به رفتارهای ربات نشان دادهاند.
- با این حال،.
- بیشتر رویکردهای فعلی به سیاستهای دیداری حرکتی سرتاسری متکی هستند که غیرشفاف باقی میمانند و تجزیه و تحلیل.
چه اتفاقی افتاد
چکیده: مدلهای زبان بینایی (VLM) اخیراً قابلیتهای قوی در نگاشت مشاهدات چندوجهی به رفتارهای ربات نشان دادهاند. با این حال،.
بیشتر رویکردهای فعلی به سیاستهای دیداری حرکتی سرتاسری متکی هستند که غیرشفاف باقی میمانند و تجزیه و تحلیل. آن دشوار است و استفاده از آنها را در برنامههای روباتیک حیاتی از نظر ایمنی محدود میکند.
در مقابل،. سیستمهای روباتیک کلاسیک اغلب بر نمایشهای خطمشی ساختاریافتهای تکیه میکنند که قابلیت تفسیر،.
مدولار بودن و اجرای واکنشی را ارائه میکنند. این کار به بررسی این موضوع میپردازد که چگونه مدلهای پایه میتوانند برای ایجاد خطمشیهای ساختار یافته ربات.
مبتنی بر ادراک چندوجهی،. پل زدن یادگیری با ابعاد بالا و کنترل نمادین،.
تخصصی شوند. ما یک رویکرد عصبی نمادین را پیشنهاد میکنیم که در آن یک VLM خطمشیهای درخت رفتار اجرایی را.
از مشاهدات بصری،. دستورالعملهای زبان طبیعی و مشخصات سیستم ساختیافته ترکیب میکند.
برای فعال کردن نظارت مقیاسپذیر بدون حاشیهنویسی دستی،. یک خط لوله خودکار را معرفی میکنیم که مجموعه دادههای چندوجهی مصنوعی از صحنههای تصادفی دامنهای را که.
با نمونههای خطمشی دستورالعمل تولید شده توسط یک مدل بنیادی جفت شدهاند،. تولید میکند.
آزمایشهای دنیای واقعی بر روی دو دستکاریکننده رباتیک نشان میدهند که سیاستهای ساختاریافته بهطور کامل از نظارت مصنوعی. با موفقیت به سیستمهای فیزیکی منتقل میشوند.
نتایج نشان میدهد که مدلهای پایه را میتوان برای تولید سیاستهای ربات قابل تفسیر و ساختارمند تطبیق داد. و جایگزینی برای رویکردهای مبهم انتها به انتها برای تصمیمگیری ربات چندوجهی ارائه کرد.
رباتیک (cs. RO) استناد بهعنوان: (یا v1 [cs.
RO] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
الساندرو آدامی [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
07:. 27:.
33 UTC (21,. 675 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
