TL;DR
- چکیده:.
- مدلهای زبان بزرگ چندوجهی (MLLM) پتانسیل قوی برای رانندگی خودکار نشان دادهاند،.
- با این حال معیارهای موجود عمدتاً من محور هستند و بنابراین نمیتوانند بهطور سیستماتیک عملکرد مدل را در.
چه اتفاقی افتاد
چکیده:. مدلهای زبان بزرگ چندوجهی (MLLM) پتانسیل قوی برای رانندگی خودکار نشان دادهاند،.
با این حال معیارهای موجود عمدتاً من محور هستند و بنابراین نمیتوانند بهطور سیستماتیک عملکرد مدل را در. شرایط رانندگی زیرساخت محور و مشارکتی ارزیابی کنند.
در این کار،. ما V2X-QA را معرفی میکنیم،.
یک مجموعه داده و معیار در دنیای واقعی برای ارزیابی MLLMها در سمت خودرو،. سمت زیرساخت،.
و دیدگاههای مشارکتی. V2X-QA حول یک پروتکل ارزیابی جداشده از دید ساخته شده است که مقایسه کنترل شده را در شرایط.
رانندگی فقط برای خودرو،. فقط زیرساخت و مشارکت در چارچوب یکپارچه پاسخگویی به سوالات چند گزینهای (MCQA) امکان پذیر میکند.
این معیار در طبقهبندی دوازده وظیفهای که شامل ادراک،. پیشبینی،.
و استدلال و برنامهریزی میشود،. دهی شده است و از طریق حاشیهنویسی MCQA تأیید شده توسط متخصص ساخته شده است تا این امکان.
را فراهم کند. تشخیص دقیق قابلیتهای وابسته به دیدگاه نتایج محک در ده مدل اختصاصی و منبعباز نشان میدهد که.
دسترسی به دیدگاه بهطور قابلتوجهی بر عملکرد تأثیر میگذارد و استدلال سمت زیرساخت از درک ترافیک ماکروسکوپی معنادار. پشتیبانی میکند.
نتایج همچنین نشان میدهد که استدلال مشارکتی همچنان چالشبرانگیز باقی میماند،. زیرا به جای ورودی بصری اضافی،.
به هم ترازی دید متقاطع و ادغام شواهد نیاز دارد. برای پرداختن به این چالشها،.
V2X-MoE را معرفی میکنیم،. یک خط پایه هم تراز با معیار با مسیریابی نمای صریح و متخصصان LoRA مختص دیدگاه.
عملکرد قوی V2X-MoE بیشتر نشان میدهد که تخصص دیدگاه صریح یک جهت امیدوارکننده برای استدلال چند دیدگاه. در رانندگی خودمختار است.
بهطور کلی،. V2X-QA پایهای برای مطالعه استدلال چند دیدگاه،.
قابلیت اطمینان،. و هوش فیزیکی مشارکتی در رانندگی مستقل متصل مجموعه داده و منابع V2X-MoE به صورت عمومیدر این.
آدرس https در دسترس هستند. موضوع: رباتیک (cs.
RO)؛ هوش مصنوعی (cs. AI)؛ بینایی و تشخیص الگوی رایانه (cs.
CV) بهعنوان: (یا v1 [cs. RO] برای این نسخه) استناد کنید) https:.
// (در انتظار ثبت نام) تاریخچه ارسال از:. Junwei You [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. 04:.
07:. 35 UTC (4,.
134 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
