TL;DR
- 11 نوامبر 2025 تحقیق اندرو لامپینن، کلاوس گرف مرورگر شما از عنصر صوتی پشتیبانی نمیکند.
- به مقاله 10 دقیقه گوش دهید تحقیقات جدید نشان میدهد که دهی مجدد نمایشهای بصری یک مدل میتواند.
- آن را مفیدتر،.
چه اتفاقی افتاد
11 نوامبر 2025 تحقیق اندرو لامپینن، کلاوس گرف مرورگر شما از عنصر صوتی پشتیبانی نمیکند. به مقاله 10 دقیقه گوش دهید تحقیقات جدید نشان میدهد که دهی مجدد نمایشهای بصری یک مدل میتواند.
آن را مفیدتر،. قویتر و قابل اعتمادتر کند هوش مصنوعی «بصری» (AI) در همه جا وجود دارد.
ما از آن برای مرتب کردن عکسهایمان، شناسایی گلهای ناشناخته و هدایت ماشینهایمان استفاده میکنیم. اما این سیستمهای قدرتمند همیشه جهان را مانند ما نمیبینند، و گاهی اوقات به شیوههای شگفتانگیزی رفتار میکنند.
برای مثال،. یک سیستم هوش مصنوعی که میتواند صدها سازنده و مدل خودرو را شناسایی کند،.
ممکن است نتواند وجوه مشترک بین خودرو و هواپیما را به تصویر بکشد،. یعنی هر دو خودروهای بزرگی هستند که عمدتاً از فلز ساخته شدهاند.
برای درک بهتر این تفاوتها،. امروز مقاله جدیدی را در Nature منتشر میکنیم که روشهای مهمیرا که سیستمهای هوش مصنوعی جهان بصری.
را متفاوت از انسان دهی میکنند،. منتشر میکنیم.
ما یک روش ارائه میدهیم برای همراستایی بهتر این سیستمها با دانش بشر،. و نشان میدهد که پرداختن به این اختلافات،.
استحکام و توانایی آنها را برای تعمیم بهبود میبخشد. این کار گامیبه سوی ساختن سیستمهای هوش مصنوعی شهودیتر و قابل اعتمادتر است.
چرا هوش مصنوعی با "غریب" مبارزه میکند وقتی گربهای را میبینید،. مغز شما یک تصویر ذهنی ایجاد میکند که همه چیز را در مورد گربه مانند رنگ و.
مفهوم اولیه اش به تصویر میکشد. "گربه بودن.
" مدلهای بینایی هوش مصنوعی همچنین با نگاشت تصاویر به نقاطی در فضایی با ابعاد بالا که در. آن موارد مشابه (مانند دو گوسفند) نزدیک به هم قرار میگیرند و موارد مختلف (یک گوسفند و یک.
کیک) از هم فاصله دارند،. نمایشهایی تولید میکنند.
برای درک تفاوتها در نحوه دهی بازنماییهای انسان و مدل، ما از تکلیف کلاسیک «افراد-یک-بیرون» استفاده کردیم. با بقیه جور در نمیاد این تست نشان میدهد که آنها کدام دو مورد را شبیه به.
هم میبینند. گاهی اوقات، همه موافق هستند.
با توجه به یک کیک تاپیر،. یک گوسفند و یک کیک تولد،.
هم انسانها و هم مدلها بهطور قابل اعتمادی کیک را بهعنوان کیک عجیب و غریب انتخاب. میکنند.
در مواقع دیگر، پاسخ درست نامشخص است و افراد و مدلها با هم موافق نیستند. جالب اینجاست که ما موارد زیادی را نیز پیدا کردیم که در آن انسانها به شدت بر روی.
یک پاسخ موافق هستند،. اما مدلهای هوش مصنوعی اشتباه میکنند.
در مورد سومین مثال زیر، اکثر مردم موافق هستند که ستاره دریایی عجیب است. اما اکثر مدلهای بینایی بیشتر بر روی ویژگیهای سطحی مانند رنگ پس زمینه و بافت تمرکز.
میکنند و به جای آن گربه را انتخاب میکنند. سه تصویر از سوژهها در دنیای طبیعی در سه ردیف نشان داده شده است.
ردیف اول یک کار آسان را نشان میدهد که در آن انسانها و مدلها همسو. میشوند.
ردیف دوم مثالی را نشان میدهد که در آن انسانها و مدلهای هوش مصنوعی با. هم موافق نیستند.
ردیف سوم یک مثال را نشان میدهد جایی که انسانها تمایل دارند موافق باشند،. اما مدلها انتخاب متفاوتی انجام میدهند.
این مثال یک ناهماهنگی سیستماتیک بین انسان و هوش مصنوعی را نشان میدهد که ما در بسیاری از. مدلهای بینایی مختلف مشاهده کردیم،.
از طبقهبندیکننده تصویر گرفته تا مدلهای بدون نظارت. بدون ساختار،.
با نمایشهایی برای دستههای مختلف مانند حیوانات،. غذا و مبلمان که همه با هم مخلوط شده اند.
ساختار سمت راست،. پس از اعمال روش هم ترازی که در آن دستهها به وضوح دهی شدهاند،.
نقشه نمایش بهبود یافته است. دو نقشه نمایشهای مدل بینایی را از دستههای مختلف اشیاء نشان میدهند.
قبل از تراز (سمت چپ) هیچ قابل مشاهدهای وجود ندارد. پس از تراز (راست) نمایشها بهطور معناداری بر اساس دسته بندی دهی میشوند.
A روش هم ترازی چند مرحلهای دانشمندان علوم شناختی مجموعه داده THINGS را که حاوی میلیونها قضاوت فردی انسان. است،.
جمعآوری کردهاند که میتوانستیم برای کمک به حل مشکل تراز بینایی استفاده کنیم. متأسفانه،.
این مجموعه داده تنها از چند هزار تصویر استفاده میکند - اطلاعات کافی برای تنظیم مستقیم مدلهای بینایی. قدرتمند،.
که بلافاصله روی این مجموعه کوچک از تصاویر بیش از حد قرار میگیرند و بسیاری از مهارتهای قبلی. خود را فراموش میکنند.
با انجماد کردن مدل اصلی و منظم کردن دقیق آموزش آداپتور،. ما یک مدل معلم ایجاد کردیم که آموزشهای قبلی خود را فراموش نمیکند.
این مدل معلم سپس بهعنوان پایهای برای قضاوتهای انسان مانند عمل میکند،. که ما از آن برای تولید مجموعه دادههای عظیم جدید به نام AligNet استفاده کردیم.
میلیونها تصمیم انسانمانند با استفاده از میلیونها تصویر مختلف - بسیار بیشتر از آنچه که میتوانیم از افراد. واقعی جمعآوری کنیم.
در نهایت، ما از این مجموعه داده جدید برای تنظیم دقیق سایر مدلهای هوش مصنوعی ("دانشجویان") استفاده کردیم. به دلیل تنوع مجموعه دادههای ما،.
تطبیق بیش از حد دیگر مسئلهای نیست و دانشآموزان را میتوان بهطور کامل آموزش داد و میتوانند نقشههای. داخلی خود را عمیقتر بازسازی کنند.
همانطور که در نمودار زیر نشان داده شده است،. نمایشهای دانشآموز از یک ترکیب بدون ساختار به یک کاملاً ساختاریافته تغییر میکند که در آن مفاهیم سطح.
بالا مانند حیوانات (آبی) و اقلام غذایی جدا شده از سه نوع شیء سبز (سبز). روش هم ترازی مدل.
دانش انسان بر اساس سطوح مختلف شباهت دهی میشود. وقتی مدلها را با دانش انسانی همسو میکنیم، نمایشهای مدل بر اساس این سطوح شباهت تغییر میکنند.
این دهی مجدد به دنبال ساختار سلسله مراتبی دانش بشری که از علم شناختی شناخته شده است. در طول همسویی،.
میبینیم که بازنماییها به نسبت "فاصله مفهومی" آنها در سلسله مراتب رده انسان از هم جدا. میشوند یا کنار هم میروند.
برای مثال،. دو سگ (همان دسته فرعی) به هم نزدیکتر میشوند (کاهش فاصله)،.
در حالی که یک جغد و یک کامیون (دستههای برتر مختلف) از هم دورتر میشوند (افزایش فاصله). نمودار خطی تغییر در فواصل نسبی بین بازنمایی انسان و هوش مصنوعی را نشان میدهد.
نمایشهای دستههای بسیار مشابه تمایل به نزدیکتر شدن به یکدیگر دارند،. در حالی که نمایشهای جفتهای مشابه کمتر تمایل دارند از هم دورتر شوند.
ما میتوانیم نتیجه بگیریم که روش ما نقشه بازنمایی دانشآموز هوش مصنوعی را بر اساس سلسلهمراتب مفهومیانسانی. دهی میکند،.
بدون اینکه بهطور صریح برای انجام این کار نظارت شود. آزمایش مدلهای هم تراز ما ما هم ترازی خود را آزمایش کردیم.
مدلهایی روی بسیاری از کارهای علوم شناختی - از جمله کارهایی مانند چند ترتیب،. مرتب کردن بسیاری از تصاویر بر اساس شباهتشان - و مجموعه دادههای عجیب و غریب جدیدی به نام.
Levels که جمعآوری کردیم. در هر مورد،.
مدلهای هم تراز ما بهطور چشمگیری همسویی انسان را بهبود بخشیدهاند،. و اغلب با قضاوتهای انسان در طیف وسیعی از وظایف بصری موافق هستند.
مدلهای ما حتی نوعی عدم قطعیت «شبیه انسان» را یاد گرفتند. در آزمایش،.
مدل-تصمیم-عدم قطعیت به شدت با مدت زمانی که انسانها طول میکشد تا انتخاب کنند همبستگی دارد. - یک معیار پراکسی رایج برای عدم قطعیت.
ما همچنین دریافتیم که همسو شدن بیشتر مدلها با انسان،. آنها را بهطور کلی مدلهای بینایی بهتری میکند.
مدلهای هم تراز ما در کارهای چالشبرانگیز مختلف،. مانند یادگیری دستهبندی جدید از یک تصویر واحد («آموزش چند شات»)،.
یا تصمیمگیری قابل اعتماد،. حتی زمانی که نوع تصاویر آزمایششده تغییر کرد،.
بسیار بهتر عمل کردند. "تغییر توزیع").
دو نمودار میلهای نشان میدهد که مدلهای تراز شده ما (آبی تیره) در کارهای علوم. شناختی که شامل کارهای عجیب و غریب و چند ترتیبی (بالا) و هوش مصنوعی شامل یادگیری و تغییر.
توزیع چند عکس (پایین) از مدلهای اصلی (خاکستری روشن) بهتر است. ساختار دانش بشری این تحقیق روشی ممکن را برای پرداختن به این موضوع ارائه میکند و نشان میدهد.
که مدلها میتوانند بهتر با قضاوتهای انسان همسو شوند و با اطمینان بیشتری در وظایف استاندارد هوش مصنوعی. مختلف عمل کنند.
در حالی که کارهای همسویی بیشتری باید انجام شود،. کار ما گامیبه سوی سیستمهای هوش مصنوعی قویتر و قابل اعتمادتر را نشان میدهد.
درباره کارمان بیشتر بدانید. همکاران فریدا بورن، برنهارد اسپیتزر، سایمون کورنبلیت، مایکل سی.
موزر، کلاوس رابرت مولر و توماس آنترتینر.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
