TL;DR
- PDF را مشاهده کنید چکیده:.
- تفسیر دستورات چند رسانهای پویا و ناهمگن با پاسخگویی در زمان واقعی برای تعامل انسان و ربات.
- حیاتی است.
چه اتفاقی افتاد
PDF را مشاهده کنید چکیده:. تفسیر دستورات چند رسانهای پویا و ناهمگن با پاسخگویی در زمان واقعی برای تعامل انسان و ربات.
حیاتی است. ما VA-FastNavi-MARL را ارائه میکنیم،.
چارچوبی که ورودیهای صوتی و تصویری ناهمزمان را در یک نمایش نهفته یکپارچه تراز میکند. روش ما با در نظر گرفتن دستورالعملهای متنوع بهعنوان توزیعی از اهداف قابل کشتیرانی از طریق یادگیری.
فرا تقویتی،. انطباق سریع با دستورالعملهای نادیده با سربار استنتاج ناچیز را امکان پذیر میکند.
برخلاف رویکردهایی که با پردازش حسی سنگین در تنگنا قرار میگیرند،. جریان مدالیته-آگنوستیک ما کنترل یکپارچه و با تأخیر کم را تضمین میکند.
اعتبارسنجی در یک فضای کاری چند بازویی تأیید میکند که VA-FastNavi-MARL بهطور قابلتوجهی از خطوط پایه در کارایی. نمونه بهتر عمل میکند و اجرای قوی و بیدرنگ را حتی در جریانهای چندرسانهای پر سر و صدا.
حفظ میکند. پذیرفته شده در کنفرانس بین المللی IEEE 2026 در چند رسانهای و نمایشگاه (ICME 2026) رباتیک (cs.
RO) استناد بهعنوان: (یا v1 [cs. RO] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) مرجع مجله:. 2026 کنفرانس بین المللی IEEE در چند رسانهای و نمایشگاه (ICME) تاریخچه ارسال از:.
Yang Zhang [مشاهده ایمیل] [v1] یکشنبه،. 5 آوریل 2026،.
07:. 05:.
49 UTC (966 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
