TL;DR
- چکیده:.
- ردیابی چند هدفه فعال به یک ربات متحرک نیاز دارد تا اکتشاف برای اهداف شناسایی نشده را با.
- بهره برداری از اهداف ردیابی نامشخص متعادل کند.
چه اتفاقی افتاد
چکیده:. ردیابی چند هدفه فعال به یک ربات متحرک نیاز دارد تا اکتشاف برای اهداف شناسایی نشده را با.
بهره برداری از اهداف ردیابی نامشخص متعادل کند. سیاستهای انتشار بهعنوان یک رویکرد قدرتمند برای گرفتن استراتژیهای رفتاری متنوع با یادگیری دنبالههای عمل از تظاهرات متخصص.
ظاهر شدهاند. با این حال،.
روشهای موجود بهطور ضمنی از بین استراتژیها از طریق فرآیند حذف نویز،. بدون تعیین کمیت عدم قطعیت در مورد اینکه کدام استراتژی باید اجرا شود،.
انتخاب میکنند. ما انتخاب متخصص برای سیاستهای انتشار را بهعنوان یک مشکل راهزن متنی آفلاین فرموله میکنیم و یک چارچوب.
بیزی برای انتخاب استراتژی بدبینانه و آگاه از عدم قطعیت پیشنهاد میکنیم. یک مدل آخرین لایه بیزی متغیر چند سر (VBLL) عملکرد ردیابی مورد انتظار هر استراتژی خبره را با.
توجه به وضعیت باور فعلی پیشبینی میکند و هم تخمین نقطهای و هم عدم قطعیت پیشبینیکننده را ارائه. میکند.
با پیروی از اصل بدبینی برای تصمیمگیری آفلاین،. یک معیار حد اعتماد پایین (LCB) سپس متخصصی را انتخاب میکند که عملکرد پیشبینیشده در بدترین حالت او.
بهترین است،. و از تعهد بیش از حد به کارشناسان با پیشبینیهای غیرقابل اعتماد اجتناب میکند.
متخصص انتخاب شده یک خط مشی انتشار را برای تولید دنبالههای کنش مربوطه شرط میکند. آزمایشها روی سناریوهای ردیابی داخلی شبیهسازیشده نشان میدهند که رویکرد ما هم از سیاست انتشار پایه و هم.
روشهای دروازهبندی استاندارد،. از جمله انتخاب ترکیبی از متخصصان و خطوط پایه رگرسیون قطعی،.
بهتر عمل میکند. رباتیک (cs.
RO)؛ یادگیری ماشینی (cs. LG) استناد بهعنوان: (یا v1 [cs.
RO] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Haotian Xiang [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
19:. 05:.
22 UTC (10,. 575 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
