TL;DR
- مشاهده چکیده PDF:.
- یادگیری تعبیههای چندوجهی هم تراز از مجموعههای ضعیف جفتشده و بدون برچسب چالش برانگیز است:.
- خطوط لوله اغلب فقط ویژگیهای از پیش استخراج شده را ارائه میدهند،.
چه اتفاقی افتاد
مشاهده چکیده PDF:. یادگیری تعبیههای چندوجهی هم تراز از مجموعههای ضعیف جفتشده و بدون برچسب چالش برانگیز است:.
خطوط لوله اغلب فقط ویژگیهای از پیش استخراج شده را ارائه میدهند،. کلیپها حاوی چندین رویداد و اتفاقات جعلی هستند.
ما HSC-MAE (همبستگی معنایی سلسله مراتبی رمزگذار خودکار نقاب دار) را پیشنهاد میکنیم،. یک چارچوب دو مسیری معلم-دانشآموز که سازگاری معنایی را در سه سطح تکمیلی نمایش - از درشت تا.
ظریف اعمال میکند:. (1) همبستگی هندسه متعارف سطح جهانی از طریق DCCA،.
که همسویی و همسویی بصری را در یک همسویی صوتی و تصویری به اشتراک میگذارد. زیرفضا؛
(ب) همبستگی همسایگی-معناشناسی در سطح محلی از طریق قرابتهای نرم top-k استخراج شده توسط معلم،. که ساختار رابطهای چند مثبت را در میان نمونههای معنایی مشابه حفظ میکند.
و (iii) همبستگی شرطی سطح نمونه از طریق رمزگذاری خودکار پوشانده شده،. که جاسازیهای فردی را تضمین میکند محتوای معنایی متمایز را تحت نظارت جزئی حفظ کنید.
بهطور مشخص،. یک مسیر MAE دانشجویی با بازسازی ویژگیهای پوشانده شده و soft top-k InfoNCE با وزن نزدیک آموزش.
داده میشود. یک معلم EMA که روی ورودیهای بدون نقاب از طریق مسیر CCA کار میکند،.
هندسه متعارف پایدار و مثبتهای نرم را فراهم میکند. وزنههای چند وظیفهای قابل یادگیری،.
اهداف رقابتی را با هم تطبیق میدهند،. و کاهش اختیاری تقطیر،.
هندسه معلم را به دانشآموز منتقل میکند. آزمایشها روی AVE و VEGAS بهبودهای اساسی mAP را نسبت به خطوط پایه بدون نظارت قوی نشان میدهند،.
که تأیید میکند که HSC-MAE نمایشهای صوتی و تصویری قوی و ساختار یافتهای را ارائه میدهد. صفحه، 2 جدول، 4 شکل.
توسط IEEE ICME 2026 پذیرفته شده است چند رسانهای (cs. MM)؛ هوش مصنوعی (cs.
AI)؛ بینایی کامپیوتری و تشخیص الگو (cs. CV)؛ صدا (cs.
SD) استناد بهعنوان: (یا v1 [cs. MM] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Donghuo Zeng [مشاهده ایمیل] [v1] یکشنبه،.
5 آوریل 2026،. 19:.
08:. 51 UTC (3,.
077 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
