TL;DR
- چکیده: یک مدل زبانی تا چه حد مغرضانه است؟
- پاسخ بستگی به نحوه سوال شما دارد.
- مدلی که از انتخاب بین کاستها برای نقش رهبری امتناع میورزد،.
چه اتفاقی افتاد
چکیده: یک مدل زبانی تا چه حد مغرضانه است؟ پاسخ بستگی به نحوه سوال شما دارد.
مدلی که از انتخاب بین کاستها برای نقش رهبری امتناع میورزد،. در یک کار پر کردن جای خالی،.
کاستهای بالا را بهطور قابل اعتمادی با خلوص و کاستهای پایین را با عدم رعایت بهداشت. مرتبط میکند.
معیارهای تک وظیفهای این را از دست میدهند زیرا آنها فقط یک تکه از نمایه تعصب. یک مدل را نشان میدهند.
ما یک طبقهبندی سلسله مراتبی را معرفی میکنیم که 9 نوع سوگیری را پوشش میدهد،. از جمله محورهای مطالعه نشده مانند سوگیری کاست،.
زبانی و جغرافیایی،. که از طریق 7 کار ارزیابی که از تصمیمگیری صریح تا ارتباط ضمنی را در بر میگیرد،.
عملیاتی شده است. با ممیزی 7 LLM تجاری و وزن باز با دستورات \textasciitilde45K، سه الگوی سیستماتیک پیدا کردیم.
اولاً،. سوگیری وابسته به کار است:.
مدلها با کلیشههای موجود در پروبهای صریح مقابله میکنند،. اما آنها را در موارد ضمنی بازتولید میکنند،.
با تفاوتهای امتیاز کلیشهای تا 0. 43 بین انواع وظایف برای همان مدل و گروههای هویتی دوم،.
همسویی ایمنی نامتقارن است:. مدلها از اختصاص دادن ویژگیهای منفی به گروههای به حاشیه رانده شده خودداری میکنند،.
اما آزادانه ویژگیهای مثبت را با ویژگیهای ممتاز مرتبط میکنند. سوم،.
محورهای سوگیری که کمتر مورد مطالعه قرار گرفتهاند،. قویترین کلیشهها را در همه مدلها نشان میدهند،.
که نشان میدهد تلاش همسویی به جای شدت آسیب،. پوشش معیار را دنبال میکند.
این نتایج نشان میدهد که ممیزیهای تکمعیار بهطور سیستماتیک سوگیری LLM را نادرست توصیف میکنند و شیوههای همسویی. فعلی به جای کاهش آن،.
آسیبهای بازنمایی را پنهان میکنند. محاسبات و زبان (cs.
CL) استناد بهعنوان: (یا v1 [cs. CL] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Divyanshu Kumar [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. 03:.
03:. 21 UTC (2,.
025 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
