TL;DR
- چکیده:.
- ناوبری صوتی و تصویری به عاملی اشاره دارد که از اطلاعات دیداری و شنیداری در محیطهای پیچیده سهبعدی.
- برای انجام محلیسازی هدف و برنامهریزی مسیر استفاده میکند و در نتیجه به ناوبری مستقل دست مییابد.
چه اتفاقی افتاد
چکیده:. ناوبری صوتی و تصویری به عاملی اشاره دارد که از اطلاعات دیداری و شنیداری در محیطهای پیچیده سهبعدی.
برای انجام محلیسازی هدف و برنامهریزی مسیر استفاده میکند و در نتیجه به ناوبری مستقل دست مییابد. چالش اصلی این کار در موارد زیر نهفته است:.
چگونه عامل میتواند از وابستگی به دادههای آموزشی رهایی یابد و هنگام مواجهه با تغییرات در. محیطها و منابع صدا،.
به ناوبری مستقل با عملکرد تعمیم خوب دست یابد. برای مقابله با این چالش،.
ما یک روش ترکیبی هدایتشده صوتی برای ناوبری صوتی و تصویری را پیشنهاد میکنیم. اول،.
ما یک رمزگذار ویژگی فضایی صوتی طراحی میکنیم که بهطور تطبیقی اطلاعات وضعیت فضایی مرتبط با هدف. را از طریق مکانیزم توجه شدت صدا استخراج میکند.
بر این اساس،. ما یک همجوشی هدایتشده حالت فضایی صوتی (ASGF) را برای دستیابی به هم ترازی پویا و همجوشی تطبیقی چند.
وجهی معرفی میکنیم. ویژگیها، بهطور موثر تداخل نویز ناشی از عدم قطعیت ادراکی را کاهش میدهد.
نتایج تجربی روی مجموعه دادههای Replica و Matterport3D نشان میدهد که روش ما بهویژه در کارهای ناشنیده مؤثر. است و تعمیم بهبود یافته را تحت توزیع منبع صدا ناشناخته نشان میدهد.
مقاله اصلی (6 صفحه). پذیرفته شده برای انتشار توسط کنفرانس مشترک بین المللی در شبکههای عصبی (IJCNN 2026) صدا (cs.
SD)؛ هوش مصنوعی (cs. AI)؛ پردازش صدا و گفتار (eess.
AS) استناد بهعنوان: (یا v1 [cs. SD] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite تاریخچه ارسال از:. Yinfeng Yu [مشاهده ایمیل] [v1] پنجشنبه،.
2 آوریل 2026،. 07:.
15:. 17 UTC (1,.
107 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
