TL;DR
- چکیده:.
- تشخیص احساسات گروهی (GER) با هدف استنتاج عاطفه جمعی در محیطهای اجتماعی مانند کلاسها درس،.
- جمعیت و رویدادهای عمومیانجام میشود.
چه اتفاقی افتاد
چکیده:. تشخیص احساسات گروهی (GER) با هدف استنتاج عاطفه جمعی در محیطهای اجتماعی مانند کلاسها درس،.
جمعیت و رویدادهای عمومیانجام میشود. بسیاری از رویکردهای موجود به پردازش صریح در سطح فردی،.
از جمله چهرههای برشخورده،. ردیابی افراد،.
یا استخراج ویژگیهای هر فرد متکی هستند،. که باعث میشود خط لوله تجزیه و تحلیل فرد محور باشد و نگرانیهای مربوط به حفظ حریم خصوصی.
را در سناریوهای استقرار که فقط به درک در سطح گروه نیاز است،. افزایش میدهد.
این تحقیق VE-MD،. یک چارچوب متغیر رمزگذار-چند رمزگشا برای تشخیص احساسات گروهی تحت یک طراحی عملکردی آگاه از حریم خصوصی را.
پیشنهاد میکند. بهجای ارائه ناشناسسازی رسمییا تضمینهای رمزنگاری حریم خصوصی،.
VE-MD برای جلوگیری از نظارت صریح فردی با محدود کردن مدل برای پیشبینی تنها تأثیرات کل سطح گروه،. بدون شناسایی هویت یا خروجیهای هیجانی هر فرد طراحی شده است.
VE-MD یک پنهان مشترک را یاد میگیرد بازنمایی بهطور مشترک برای طبقه بندی احساسات و پیش بینی. درونی نمایشهای ساختاری بدن و صورت بهینه شده است.
دو استراتژی رمزگشایی ساختاری مورد بررسی قرار میگیرند:. رمزگشای PersonQuery مبتنی بر ترانسفورماتور و رمزگشای Heatmap متراکم که بهطور طبیعی اندازههای گروه متغیر را در خود.
جای میدهد. آزمایشها بر روی شش مجموعه داده در طبیعت،.
از جمله دو معیار GER و چهار معیار تشخیص احساسات فردی (IER)،. نشان میدهد که نظارت ساختاری بهطور مداوم یادگیری بازنمایی را بهبود میبخشد.
مهمتر از آن،. نتایج یک تمایز واضح بین GER و IER را نشان میدهد:.
بهینهسازی فضای پنهان به تنهایی اغلب برای GER کافی نیست زیرا تمایل به کاهش نشانههای مرتبط با تعامل. دارد،.
در حالی که حفظ خروجیهای ساختاری صریح استنتاج عاطفه جمعی را بهبود میبخشد. در مقابل،.
به نظر میرسد که نمایشهای ساختاری پیش بینی شده بهعنوان یک گلوگاه حذف نویز موثر برای. IER عمل میکنند.
VE-MD عملکرد پیشرفتهای را در GAF-3. 0 (تا 90.
06 ٪) و VGAF (82. 25 ٪ با ترکیب چند وجهی با صدا) به دست میآورد.
این نتایج نشان میدهد که حفظ اطلاعات ساختاری مرتبط با تعامل بهویژه برای مدلسازی تأثیر در سطح گروه. بدون تکیه بر استخراج ویژگیهای فردی قبلی مفید است.
در مجموعه دادههای IER با استفاده از همجوشی چندوجهی با مدالیت صوتی، VE-MD از SOTA در SamSemo (77. 9 ٪،.
اضافه کردن مدالیته متن) بهتر عمل میکند و در عین حال عملکردهای رقابتی را در MER-MULTI (63. 8 ٪)، DFEW (70.
7 ٪) و EngageNet (69. 0) به دست میآورد.
بینایی کامپیوتری و تشخیص الگو (cs. CV)؛ هوش مصنوعی (cs.
AI) استناد بهعنوان: (یا v1 [cs. CV] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Dominique Vaufreydaz [مشاهده ایمیل] [از طریق پروکسی CCSD] [v1] پنجشنبه،.
2 آوریل 2026،. 13:.
38:. 29 UTC (4,.
752 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
