Google Researchمعتبر1405/01/14 08:00زیرساخت و محاسبات

ارزیابی همسویی تمایلات رفتاری در LLM

در «ارزیابی همسویی گرایش‌های رفتاری در LLM»،. چارچوب ما رفتارهای رفتاری LLMها را ارزیابی می‌کند که در آن منش‌های رفتاری LLM می. نشان داده می‌شود.

منبع: Google Research

زیرساخت و محاسبات سیاست‌گذاری و حاکمیت آموزش و یادگیری

نسخه مطالعهعمومی

منبعGoogle Research

انتشار1405/01/14 08:00

اشتراک در تلگرام اشتراک در X اشتراک در LinkedIn

share-ready · لینک کمپین آماده است

متن پیش‌نمایش telegram با ۵۰۳ کاراکتر ساخته شده است.

اگر این خبر برایتان مفید بود، حساب بسازید.

با حساب هوش‌گیت می‌توانید خبرها را ذخیره کنید، موضوع‌ها و چهره‌های تخصصی را دنبال کنید و مسیر یادگیری یا پروژه مناسب خودتان را سریع‌تر پیدا کنید.

ساخت حساب ورود برای ذخیره و دنبال‌کردن

پیگیری گفتگو

بازگشت سریع به همین گفتگو

این گفت‌وگو را ذخیره کن، آن را دنبال کن و اگر لازم است یک یادداشت کوتاه برای بازگشت بعدی بگذار.

لایه انسانی

نویسنده انسانی، یادداشت کارشناس و شفافیت نویسندگی

این سطح مشخص می‌کند کجا انتشار با حضور انسان تقویت شده و کجا newsroom هوش مصنوعی هنوز نقش اصلی را دارد.

لایه newsroom با کمک هوش مصنوعیبدون author انسانی عمومیreview with confidence

این خبر فعلاً بیشتر در لایه newsroom و پوشش کمک‌گرفته از هوش مصنوعی قرار دارد و هنوز نویسنده انسانی مشخصی برای آن ثبت نشده است.

جانمایی امن برای اسپانسر

امتیاز جانمایی۷۰ / 100

یادداشت‌های انسانی۰

منبع در سطح trusted قرار دارد.
trust score منبع بالاست.

قدم بعدی

بعد از خواندن این خبر چه کار کنم؟

اگر این موضوع برایت مهم است، از همین‌جا آن را ذخیره کن، گفت‌وگو را دنبال کن یا به مسیر یادگیری، چهره تخصصی و پروژه مرتبط برو.

حفظ و پیگیری

این مقاله را برای بازگشت بعدی ذخیره کن، منبعش را دنبال کن یا وارد گفت‌وگوی همین خبر شو تا موضوع از دست نرود.

رفتن به گفت‌وگو

یادگیری و action بعدی

اگر می‌خواهی از خبر به فهم عمیق‌تر برسی، مسیرهای مرتبط زیر ساده‌ترین نقطه شروع‌اند.

رفتن به هاب یادگیری پروژه مرتبط

راهنمای مطالعه

منبع اصلی، تاریخ فارسی و شاخص‌های سریع این خبر.

رفتن به منبع

تاریخ فارسی1405/01/14 08:00

داستانمستقل

نکات کلیدی

این باکس براساس سطح مطالعه شما (عمومی) تنظیم شده است.

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند، درک رفتار آنها ضروری می‌شود.
در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی،.
این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم.
ما بر گرایش‌های رفتاری - گرایش‌های اساسی که پاسخ‌ها را در زمینه‌های اجتماعی شکل می‌دهند - تمرکز می‌کنیم.
و چارچوبی را معرفی می‌کنیم تا بررسی کنیم که چگونه تمایلات بیان‌شده توسط LLM با انسان‌ها مطابقت دارد.
گرایش‌های رفتاری معمولاً از طریق پرسش‌نامه‌های خودگزارش‌دهی تحت ویژگی‌های مختلف (مانند همدلی،.
قاطعیت،.

سیگنال تعامل

بازدید۰

کلیک۰

امتیاز0.00

دیدگاه۰

TL;DR

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند، درک رفتار آنها ضروری می‌شود.
در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی،.
این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم.

چه اتفاقی افتاد

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند، درک رفتار آنها ضروری می‌شود. در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی،.

این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم. ما بر گرایش‌های رفتاری - گرایش‌های اساسی که پاسخ‌ها را در زمینه‌های اجتماعی شکل می‌دهند - تمرکز می‌کنیم.

و چارچوبی را معرفی می‌کنیم تا بررسی کنیم که چگونه تمایلات بیان‌شده توسط LLM با انسان‌ها مطابقت دارد. گرایش‌های رفتاری معمولاً از طریق پرسش‌نامه‌های خودگزارش‌دهی تحت ویژگی‌های مختلف (مانند همدلی،.

همدلی،. قاطعیت،.

میزان توافق با آنها) کمیت می‌شوند. سریع اظهار نظر کنید.

" پرسشنامه‌های مورد استفاده در این مطالعه معیارهای استاندارد شده و دارای اعتبار علمی‌هستند که به‌طور گسترده. برای ارزیابی ویژگی‌های شخصیتی در تحقیقات بین‌المللی و روان‌شناسی استفاده می‌شوند،.

مانند:. IRI (همدلی)،.

ERQ (تنظیم هیجان)،. و بیشتر هر ابزار مبتنی بر ادبیات بررسی شده است که روایی روان‌سنجی و پایایی آن را با.

استفاده از راهبردهای مختلف ایجاد می‌کند. ما پرکاربردترین ابزارها را برای تحقیق خود انتخاب کردیم.

هدف ما ایجاد چنین پرسشنامه‌های روان‌شناختی است،. اما به‌کارگیری مستقیم آن‌ها برای LLM چالش‌های فنی را به همراه دارد،.

زیرا خروجی‌های LLM نسبت به تغییر عبارت و توزیع سریع حساس هستند. در نتیجه،.

تمایلات «ادعا شده» توسط LLMها در قالب خود گزارشی تضمین نمی‌شود که با موفقیت به رفتار. در تنظیمات واقعی و باز منتقل شوند.

برای رسیدگی به این چالش‌ها،. در «ارزیابی همسویی گرایش‌های رفتاری در LLM»،.

چارچوب ما رفتارهای رفتاری LLMها را ارزیابی می‌کند که در آن منش‌های رفتاری LLM می. تواند منجر به تأثیرگذاری واقعی کاربران شود.

این مطالعه گامی‌اولیه در ارزیابی همسویی بین اجماع انسانی و الگوی رفتار در سناریوهای واقعی و عملی،. با تمرکز بر تعاملات روزمره انسان به انسان و موقعیت‌های محل کار.

ما اطمینان می‌دهیم که این سناریوها بر اساس پرسشنامه‌های روان‌شناختی تثبیت‌شده برای دریافت ماهیت ویژگی‌های رفتاری اصلی باقی. می‌مانند.

سناریوهای آزمایش شده شامل خونسردی حرفه‌ای،. حل تعارض،.

وظایف عملی مانند رزرو یک سفر،. و شیوه زندگی یا تصمیم‌گیری روزانه،.

برجسته کردن رفتار مدل در تنظیماتی بود که نشان دهنده تجربیات معمولی روزمره انسان است. تجزیه و تحلیل در مقیاس بزرگ ما از 25 LLM دو نوع شکاف را نشان می‌دهد:.

یکی که در آن گرایش‌های مدل از اتفاق نظر در میان حاشیه نویسان انسانی منحرف می‌شود،. و دیگری زمانی که گرایش‌های مدل طیفی از نظرات انسانی را در صورت عدم اجماع جلب نمی.

کند. این نتایج اولیه فرصتی را برای همسویی رفتاری بهتر نشان می‌دهد تا اطمینان حاصل شود که مدل‌ها می‌توانند.

به‌طور مناسب‌تری در مسیریابی قرار گیرند تفاوت‌های ظریف پویایی اجتماعی،. نتایجی است که انتظار داریم تحقیقات آینده بر روی آنها بنا شود.

از گزارش خود تا قضاوت موقعیتی ما با جمع‌آوری گزاره‌ها از پرسشنامه‌های روان‌شناختی معتبر و معتبر شروع می‌کنیم. و آن‌ها را با بیانیه‌های تمایل عمومی‌به مشاوره مدل تطبیق می‌دهیم.

سپس از گزاره‌های اقتباس شده برای تولید آزمون‌های قضاوت موقعیتی (SJTs)،. یک روش ارزیابی که به‌طور گسترده در روان‌شناسی،.

پیش‌بینی رفتاری و سایر زمینه‌ها استفاده می‌شود،. استفاده می‌شود.

در سراسر این صنایع،. SJTها استانداردی برای ارزیابی شایستگی‌های رفتاری و قضاوت در محیط‌های پیچیده هستند.

این آزمون‌ها معمولاً شامل سناریوهای واقع‌بینانه‌ای هستند که دو مسیر عمل ممکن را ارائه می‌دهند:. یکی حمایت از یک ویژگی رفتاری خاص و دیگری مخالفت با آن.

در تحقیق ما،. هر SJT توسط سه حاشیه نویس مستقل مورد بررسی قرار می‌گیرد تا تأیید کند که سناریو و.

اقدامات (تولید شده توسط LLM) منسجم هستند و به‌طور صادقانه نشانگرهای رفتاری زیرین را نشان می‌دهند. در طول ارزیابی،.

مدل با SJT به‌عنوان ورودی پیشنهاد می‌شود و یک پاسخ طبیعی ایجاد می‌کند،. که با استفاده از یک LLM-as-a-a-judge به یکی از دو دوره عمل نگاشت می‌شود.

از آنجایی که هدف ما کمی‌کردن تمایلات رفتاری LLMها نیست،. بلکه مطالعه میزان همسویی آن‌ها با رفتار انسانی است،.

ما از یک SJ به ازای هر 10 اقدام ترجیحی،. از یک اقدام ترجیحی بدون یک اقدام SJ جمع‌آوری می‌کنیم.

550 شرکت‌کننده، و توزیع ترجیحات انسانی حاصل را با توزیع پاسخ‌های مدل در هر سناریو مقایسه کنید. همسویی جهت گرایش‌های رفتاری LLMها در اینجا ما بر روی زیر مجموعه‌ای از سناریوها تمرکز.

می‌کنیم که در آن بین حاشیه نویسان انسانی در مورد اقدام ترجیحی اتفاق نظر وجود دارد. همسویی در این موارد مهم است،.

زیرا عدم تجلی یا سرکوب یک ویژگی تحت توافق قوی انسانی نشان‌دهنده نمایه رفتاری است که تمایل دارد. متفاوت از الگوهای رفتاری معمولی انسان عمل کند.

ما هم ترازی جهت‌دار را به‌عنوان معیاری قابل تفسیر تعریف می‌کنیم که آزمایش می‌کند آیا مدل احتمال بیشتری را. به عمل مورد حمایت اکثریت انسانی اختصاص می‌دهد یا خیر.

سپس هم ترازی مدل با درصد سناریوهایی که این معیار برآورده می‌شود، کمی‌سازی می‌شود. شکل زیر نتایج را در 25 LLM مختلف و چهار صفت مجزا نشان می‌دهد.

نتایج بر اساس سطح اجماع در میان حاشیه نویسان انسانی (از 10 پاسخ در هر سناریو) گروه بندی. می‌شوند:.

اتفاق آرا (10/10)،. بسیار زیاد (9،.

10) و زیاد اجماع (8 و 9). مدل‌های کوچکتر (&amp;amp;amp;amp;lt;25B) تراز جهت جهت قابل توجهی کمتری را نشان می‌دهند،.

همانطور که با شیوع بیشتر سلول‌های قرمز و نارنجی در ردیف‌های پایین زیر خط افقی سیاه. نشان داده می‌شود.

این مدل‌های کوچک‌تر اغلب بین بیان مناسب یا سرکوب صفات تمایز قائل نمی‌شوند،. اغلب با اجماع با نرخ‌های نزدیک به شانس همسو می‌شوند.

مدل‌های ظرفیت بزرگ (&amp;amp;amp;amp;gt; 120B) و وزن‌های بسته مرزی بهبود قابل‌توجهی را نشان می‌دهند و زمانی که اتفاق. نظر بین حاشیه‌نویسان انسانی اتفاق نظر باشد،.

به هم ترازی نزدیک به کامل می‌رسند. با این حال،.

هم ترازی این مدل‌ها هنوز در دهه 80 پایین تا اواسط فلات است،. زمانی که اجماع کمتر از 90% است.

تجزیه و تحلیل کیفی مواردی که LLMها از حالت رفتاری ترجیحی در سناریوهای با اجماع بالا منحرف. می‌شوند،.

چندین الگوی جالب را نشان داد. مدل‌ها تمایل به تشویق باز بودن احساسی در محیط‌های حرفه‌ای دارند که در آن انسان‌ها خونسردی را توصیه.

می‌کنند. در اجتماعی در اختلافات، مدل‌ها بر خلاف ترجیحات شرکت‌کنندگان، غالباً هماهنگی را به ایستادن در موضع اولویت می‌دهند.

در نهایت،. مدل‌ها گاهی اوقات تکانشگری بالاتری نسبت به انسان‌ها نشان می‌دهند،.

و توصیه می‌کنند که برای فرصت‌های حساس به زمان،. اقدام فوری بر روی تأیید لجستیکی انجام شود.

فقدان همسویی توزیعی کثرت گرایی توزیعی یک اصل انصافی است که استدلال می‌کند که توزیع پاسخ‌های. یک مدل باید به‌طور دقیق منعکس کننده تنوع دیدگاه‌های انسانی باشد تا اینکه بر روی یک پاسخ.

واحد و غالب همگرا شود. برای درک این موضوع در تنظیمات ما،.

در مواردی که انسان‌ها توافق کمتری در مورد عمل ترجیحی دارند،. جرم احتمال مدل باید به‌طور مساوی بین دو عمل ممکن توزیع شود و در نتیجه اطمینان کمتری نسبت.

به عملکرد ترجیحی آن ایجاد شود. شکل زیر اطمینان مدل را به‌عنوان تابعی از توافق انسان نشان می‌دهد.

در حالی که اطمینان یک مدل کاملاً همسو با توزیع باید متناسب با اجماع بین حاشیه‌نویس‌های انسانی مقیاس. شود (خط مشکی نقطه‌دار)،.

همه ۲۵ مدل ارزیابی‌شده (خطوط آبی) اعتماد بیش از حد سیستماتیک به تصمیم خود نشان می‌دهند. خط آبی یکدست - که میانگین 25 LLM را نشان می‌دهد - این را نشان می‌دهد.

مدل‌ها نشان دهنده ابهام ذاتی و طیف کامل نظرات از حاشیه نویسان انسانی نیستند. حتی در مواردی با اجماع پایین که نظرات انسانی به‌طور قابل توجهی تقسیم شده است (توافق 50 تا.

60 درصد)،. اطمینان در تمام مدل‌های ارزیابی شده بالا باقی می‌ماند.

LLMها زمانی موضع می‌گیرند که انسان‌ها اجماع پایینی دارند. ما ثابت کردیم که وقتی اجماع بین حاشیه نویسان انسانی در مورد اقدام ترجیحی کم است،.

LLMها چنین ابهامی‌را نشان نمی‌دهند که به‌عنوان اعتماد بیش از حد منعکس می‌شود. در شکل زیر نشان می‌دهیم که جهت این اطمینان بیش از حد،.

حتی بین مدل‌های مرزی،. بسیار متفاوت است.

این نشان می‌دهد که روش‌های مختلف آموزش و همسویی منجر به گرایش‌های رفتاری منحصربه‌فرد می‌شود. خود گزارش دهی و رفتار آشکار اعتبار ارزیابی تمایلات LLM از طریق توافق خود گزارش دهی با اظهارات.

پرسشنامه یک حوزه فعال تحقیقاتی است. در حالی که برخی از محققان اعتبار سازه این رویکرد را زیر سوال می‌برند،.

برخی دیگر استدلال می‌کنند که چارچوب‌های محرک خاص ارزیابی قابل اعتماد را امکان پذیر می‌کند. در حالی که حل این بحث فراتر از محدوده این کار است،.

چارچوب ما - که آیتم‌های پرسشنامه را مستقیماً به سناریوهای رفتاری ترسیم می‌کند - یک لنز. منحصر به فرد برای مطالعه این پویایی‌ها ارائه می‌دهد.

شکل زیر یک واگرایی قابل توجه بین گزارش خود LLM و رفتار آشکار آنها را نشان می‌دهد. به‌عنوان مثال،.

مدل‌ها اغلب خودشان گزارش می‌دهند که تکانشگری پایینی دارند،. اما تمایل رفتاری به سمت تکانشگری را نشان می‌دهند.

هنگام بررسی توزیع در هر صفت،. تناقضات واضحی نیز بین گزارش خود LLM و رفتار آشکار آنها وجود دارد.

این تحلیل محدودیت‌های بالقوه را در اعتبار گزارش‌دهی مستقیم خود نشان می‌دهد و کاربرد چارچوب ما را به‌عنوان. پایه‌ای برای تحقیقات آینده برجسته می‌کند.

بحث به‌عنوان کمک اولیه به مطالعه مداوم ما در مورد رفتار و همسویی مدل،. ما چارچوبی را برای ارزیابی تمایلات رفتاری در LLM معرفی می‌کنیم و رویکرد خود را در روش پرسشنامه‌های.

تثبیت‌شده پایه‌گذاری می‌کنیم و در عین حال به محدودیت‌های معیارهای خودگزارش‌دهی سنتی می‌پردازیم. این چارچوب راهی را برای اندازه‌گیری شکاف‌ها ارائه می‌کند،.

که در آن مدل‌ها به‌طور مداوم اجماع میان حاشیه‌نویس‌های انسانی را در سناریوهای با توافق بالا منعکس نمی‌کنند. و طیف نظرات را در سناریوهای با اجماع پایین کمتر نشان می‌دهند.

این یک گام به جلو در درک تمایلات رفتاری مدل است،. و تحقیقات بیشتری در زمینه‌های حیاتی مانند ارزیابی و رسیدگی به شکاف‌های شناسایی‌شده مورد نیاز است.

برای بررسی عمیق‌تر روش‌شناسی و نتایج، مقاله را در اینجا بخوانید. قدردانی این تحقیق توسط امیر تاوبنفلد،.

زوریک گخمان،. لیور نزری،.

عمری فلدمن،. ناتالی هریس،.

شاشیر ردی،. رومینا استلا،.

آریل گلدشتاین،. ماریان کرواک،.

یوسی ماتیاس و امیر فدر انجام شد. از Itay Laish،.

Renee Shelby،. Nino Scherrer،.

Sivan Eiger،. Saška Mojsilović،.

Avinatan Hassidim،. Ronit Levavi Morad و James Manyika برای بررسی کار و پیشنهادات ارزشمندشان تشکر می‌کنیم.

چرا مهم است

اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیم‌گیری سازمانی اثر می‌گذارد.

منبع

لینک منبع اصلی در کارت و صفحه مقاله نمایش داده می‌شود.

اعتبار

چرایی اعتماد به این خبر

امتیاز اعتبار، منطق اعتماد، وضعیت راستی‌آزمایی و لاگ تغییرات در یک نگاه.

اعتبار خبر۴۳ / 100

اعتبار منبع۱۳ / 100

اعتبار موضوع۱۰۰ / 100

تازگی۴۴ / 100

مرحله عمر خبرNEEDS_UPDATE

نیاز به به‌روزرسانیبله

نیازمند تقویتنیازمند تقویتمرجع قوینیازمند بازبینینیازمند به‌روزرسانی

تصمیم انسانی تحریریه

خلاصه تصمیم تحریریه

سیگنال بازبینی باز استsecurity / policy review requiredنیاز بازبینی قابل مشاهده استlegal / policy escalation

این مقاله در مسیر security / policy review required قرار دارد و بخشی از سیگنال‌های review هنوز باید تکمیل یا شفاف‌تر شود.

دلیل انتشار: خبرهای امنیتی، رگولاتوری و اخلاقی به دلیل اثر عمومی و حساسیت claimها باید قبل از publish با بازبینی انسانی کامل عبور کنند. وضعیت فعلی: fact-check not_started و checklist ۰٪.

کلاس خبرSECURITY_POLICY

سخت‌گیری بازبینیSTRICT_REQUIRED

بازبینثبت عمومی نشده

موارد بازبینی که باید شفاف‌تر شوند

صحت و منبع اصلی تایید شدتیتر بازبینی و حرفه‌ای شدخلاصه برای کارت و SEO تایید شدبدنه از نظر خوانایی و ساختار بازبینی شدنسخه‌های سطح‌بندی‌شده بررسی شدبازخوانی نهایی انجام شد

سیاست تحریریه و اصلاحات چرا به هوش‌گیت اعتماد کنیم؟

چرا این خبر قابل اعتماد است

شفافیت راستی‌آزمایی ادعاها

ادعای تاییدشده۰

نیازمند بازبینی۰

میانگین اطمینان۰٪

چرا هنوز مهم است

این خبر هنوز بازدید، کامنت یا follow-up کافی دارد و از چرخه توجه مخاطب خارج نشده است.

تقویت اعتبار

وجود follow-up و پوشش مرتبط، authority این خبر را در طول زمان تقویت می‌کند.

پیگیری به‌روزرسانی

این خبر evergreen است و برای حفظ authority به refresh تحریریه نیاز دارد.

بخش منابع و ارجاع‌ها

لینک‌های منبع اصلی، ارجاع‌های ادعا و referenceهای مکمل برای پیگیری مستقیم.

research.googleمنبع اصلی

research.google/blog/evaluating-alignment-of-behavioral-dispositions-in-

research.googleارجاع تکمیلی

research.google/blog/

پوشش‌های پیگیری

پیگیری‌های بعدی، توضیح‌دهنده‌های مرتبط یا خبرهای مکملی که عمر این موضوع را بعد از انتشار ادامه می‌دهند.

یک روش گالرکین ناپیوسته ترکیبی همگرا برای انیشتین -- معادلات اسکالر

پیگیری بعدی

1405/01/29 15:44

یک اپراتور فتوآکوستیک فوروآکوستیک-پیوسته سازگار با قانون متقابل

پیگیری بعدی

1405/01/29 15:44

عدم وجود احتمالات و دم پایین در رژیم بحرانی از طریق انتشار باور

پیگیری بعدی

1405/01/29 15:44

توابع مانع کنترل ماتریس مرتبه بالا: حالت خوب و امکان سنجی از طریق درجه نسبی ماتریس

پیگیری بعدی

1405/01/29 15:44

تعامل کاربران و کیفیت خبر

امتیاز بدهید، نظر ثبت کنید یا اگر خطایی دیدید گزارش اصلاح بفرستید. moderation، trust contributor و کیفیت thread به‌صورت شفاف نمایش داده می‌شود.

بازدید

کلیک روی خبر

امتیاز میانگین

0.00 / 5

دیدگاه تایید شده

وضعیت trust گفتگو

کیفیت thread براساس reputation contributorها، رأی‌ها و moderation سنجیده می‌شود.

در حال بارگذاری

امتیاز thread

۰ / 100

دیدگاه متخصص

دیدگاه مفید

خروجی moderation و قوانین

تاییدشده: ۰pending: ۰hidden/spam: ۰

حضور انسانی در این گفتگو

این بخش کمک می‌کند thread فقط حول personaها دیده نشود و contributorهای انسانی واقعی هم واضح باشند.

contributor انسانی: ۰trusted: ۰expert: ۰

هنوز contributor انسانی برجسته‌ای در این thread دیده نشده است.

امتیاز شما به خبر

هنوز امتیاز نداده‌اید.

واکنش سریع به خبر

به‌جای لایک کلی، نوع برداشت خودتان را مشخص کنید.

ثبت دیدگاه

دیدگاه‌های کم‌ارزش یا spam به‌صورت خودکار محدود می‌شوند و نتیجه moderation در همین صفحه قابل مشاهده است.

گزارش اصلاح یا بهبود

اگر claim، ترجمه، منبع یا framing خبر نیاز به اصلاح دارد، این مسیر مستقیم برای تیم تحریریه است.

آخرین دیدگاه‌ها

هنوز دیدگاهی ثبت نشده است.

مقایسه سه سطح مطالعه

برای همین خبر، نسخه ساده، عمومی و تخصصی کنار هم خلاصه شده‌اند.

ساده

۹٬۵۱۵ کاراکتر

شود. شود،. همسویی مدل،.

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند،.
درک رفتار آنها ضروری می‌شود.
در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی،.
این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم.

عمومی

۹٬۵۲۱ کاراکتر

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند، درک رفتار آنها ضروری می‌شود.
در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی،.
این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم.
ما بر گرایش‌های رفتاری - گرایش‌های اساسی که پاسخ‌ها را در زمینه‌های اجتماعی شکل می‌دهند - تمرکز می‌کنیم.

تخصصی

۹٬۶۳۱ کاراکتر

در «ارزیابی همسویی گرایش‌های رفتاری در LLM»،. از آنجایی که هدف ما کمی‌کردن تمایلات رفتاری LLMها نیست،. نشان می‌دهند.

همانطور که LLMها در زندگی روزمره ما ادغام می‌شوند، درک رفتار آنها ضروری می‌شود.
در تلاش‌های مداوم خود برای مطالعه رفتار مدل و همسویی، این کار را به‌عنوان گامی‌اولیه در آن جهت ارائه می‌کنیم.
ما بر گرایش‌های رفتاری - گرایش‌های اساسی که پاسخ‌ها را در زمینه‌های اجتماعی شکل می‌دهند - تمرکز می‌کنیم و چ...
تمایلات بیان‌شده توسط LLM با انسان‌ها مطابقت دارد.

هایلایت‌ها و یادداشت‌ها

متن دلخواه را در خبر انتخاب کنید و با یک کلیک هایلایت بزنید. فقط برای شما قابل مشاهده است.

برای استفاده از هایلایت و یادداشت، وارد حساب کاربری شوید.

منابع اولیه

لینک‌های اصلی این خبر، شامل منبع اصلی و ارجاع‌های claim panel.

کاوش این مقاله

از این خبر به موضوع، persona، درس، پروژه و مسیر یادگیری مرتبط برسید.

پرسش از هوش‌گیت

موضوع‌های این مقاله

زیرساخت و محاسبات سیاست‌گذاری و حاکمیت آموزش و یادگیری پژوهش پیشرفته

موجودیت‌های این مقاله

هنوز موجودیت ثبت‌شده‌ای برای این مقاله دیده نمی‌شود.

چهره‌های مرتبط

هنوز persona signal معناداری برای این مقاله ثبت نشده است.

درس‌های مرتبط

هنوز درس مرتبطی برای این مقاله پیدا نشده است.

پروژه‌های مرتبط

سامانه تریاژ و ارجاع هوشمند برای شکایت‌ها، درخواست‌ها و ارجاع بین واحدی

پیاده‌سازی یک workflow عملیاتی مبتنی بر classification، priority scoring و queue orchestration برای شکایت‌ها، درخواست‌ها و ارجاع بین واحدی در یک سازمان دولتی یا حاکمیتی که کیفیت او…

agents · product-industry

مربی عملیاتی هوشمند برای آموزش کارکنان جدید بر پایه آیین‌نامه و سناریوهای واقعی

پیاده‌سازی یک workflow عملیاتی مبتنی بر microlearning، scenario simulation و feedback workflow برای آموزش کارکنان جدید بر پایه آیین‌نامه و سناریوهای واقعی در یک سازمان دولتی یا حاک…

learning · prompt-design

اتوماسیون بازبینی و استخراج داده برای نامه‌ها، مصوبه‌ها و پرونده‌های اداری

ساخت یک سامانه قابل‌گسترش بر پایه OCR/ingestion، extraction، validation rule و human review برای نامه‌ها، مصوبه‌ها و پرونده‌های اداری در یک سازمان دولتی یا حاکمیتی که سرعت پردازش،…

agents · product-industry

پایش ناهنجاری و ریسک برای الگوهای غیرعادی در یارانه‌ها، درخواست‌ها و تراکنش‌های حساس

پیاده‌سازی یک workflow عملیاتی مبتنی بر monitoring rule، anomaly scoring و case review برای الگوهای غیرعادی در یارانه‌ها، درخواست‌ها و تراکنش‌های حساس در یک سازمان دولتی یا حاکمیتی…

llm-evaluation · infrastructure-compute

دستیار دانش و پاسخ‌گویی برای قوانین، خدمات و وضعیت پرونده‌های میز خدمت شهروندی

طراحی و استقرار یک راهکار RAG فارسی، کنترل استناد و workflow پاسخ‌گویی برای قوانین، خدمات و وضعیت پرونده‌های میز خدمت شهروندی در یک سازمان دولتی یا حاکمیتی که زمان یافتن پاسخ، کیفی…

rag · agents

مسیرهای یادگیری

هنوز مسیر یادگیری نزدیکی برای این مقاله پیدا نشده است.

بعدش چی بخونم؟

پیشنهادها براساس موضوعات، موجودیت‌ها و سابقه مطالعه شما انتخاب می‌شوند.

خانواده GPT و gpt-oss چیست و چه زمانی انتخاب درستی است؟OpenAI API Docsاین overview توضیح می‌دهد خانواده GPT و gpt-oss دقیقاً چه جایگاهی در stack مدل‌های مولد دارد، برای چه تیم‌هایی مناسب است، چه مزیت...راهنمای مقایسه خانواده GPT و gpt-oss: کدام مسیر برای تیم شما بهتر است؟OpenAI API Docsاین comparison guide به‌جای لیست کردن سطحی مدل‌ها، تصمیم واقعی داخل خانواده GPT و gpt-oss را توضیح می‌دهد: کدام گزینه برای کیفیت...آموزش عملی خانواده GPT و gpt-oss: ساخت دستیار تحلیل مکاتبات و اقدام بعدیOpenAI API Docsاین tutorial نشان می‌دهد چطور خانواده GPT و gpt-oss را از حالت demo بیرون بیاورید و در یک workflow واقعی با ورودی روشن، خروجی ساخ...نصب و راه‌اندازی خانواده GPT و gpt-oss: از اولین درخواست تا مسیر پایدارOpenAI API Docs مبانی استفاده حرفه‌ای از دستیارهای زبانی در تیم: از مسئله تا خروجی قابل اتکاHooshgate Learn Deskاین راهنمای بنیادین توضیح می‌دهد استفاده حرفه‌ای از دستیارهای زبانی در تیم فقط کنار هم چیدن چند ابزار نیست و چگونه باید با دامنه...

دسته‌های مرتبط:پژوهشسیاست‌گذاری

برچسب‌ها:LLM

فهرست خبرها

ارزیابی همسویی تمایلات رفتاری در LLM

بازگشت سریع به همین گفتگو

نویسنده انسانی، یادداشت کارشناس و شفافیت نویسندگی

بعد از خواندن این خبر چه کار کنم؟

TL;DR

چه اتفاقی افتاد

چرا مهم است

منبع

چرایی اعتماد به این خبر

خلاصه تصمیم تحریریه

بخش منابع و ارجاع‌ها

پوشش‌های پیگیری

وضعیت trust گفتگو

خروجی moderation و قوانین

حضور انسانی در این گفتگو

امتیاز شما به خبر

واکنش سریع به خبر

ثبت دیدگاه

گزارش اصلاح یا بهبود

آخرین دیدگاه‌ها

مقایسه سه سطح مطالعه

ساده

عمومی

تخصصی

منابع اولیه

کاوش این مقاله

موضوع‌های این مقاله

موجودیت‌های این مقاله

چهره‌های مرتبط

درس‌های مرتبط

پروژه‌های مرتبط

مسیرهای یادگیری

پست‌های مرتبط نبض هوش

خبرهای مرتبط

بعدش چی بخونم؟