TL;DR
- Claude Sonnet 4.
- 6 تواناترین مدل Sonnet تاکنون است.
- این ارتقای کامل مهارتهای مدل در زمینه کدنویسی،.
چه اتفاقی افتاد
Claude Sonnet 4. 6 تواناترین مدل Sonnet تاکنون است.
این ارتقای کامل مهارتهای مدل در زمینه کدنویسی،. استفاده از کامپیوتر،.
استدلال با زمینه طولانی،. برنامهریزی عامل،.
کار دانش و طراحی است. Sonnet 4.
6 همچنین دارای یک پنجره زمینه توکن 1M در نسخه بتا است. برای کسانی که در برنامههای Free و Pro ما هستند، Claude Sonnet 4.
6 اکنون مدل پیش فرض در claude. ai و Claude Cowork است.
قیمتگذاری مانند Sonnet 4. 5 باقی میماند و از 3 دلار/15 دلار به ازای هر میلیون توکن شروع میشود.
6 مهارتهای کدنویسی بسیار بهبود یافتهای را برای تعداد بیشتری از کاربران ما به ارمغان میآورد. بهبود در سازگاری،.
پیروی از دستورالعملها و موارد دیگر باعث شده است که توسعه دهندگان با دسترسی اولیه Sonnet 4. 6 را با اختلاف زیادی به نسخه قبلی خود ترجیح دهند.
آنها اغلب حتی آن را به هوشمندترین مدل ما از نوامبر 2025، Claude Opus 4. 5 ترجیح میدهند.
عملکردی که قبلاً نیاز به دستیابی به یک مدل کلاس Opus - از جمله کارهای اداری در دنیای. واقعی و از نظر اقتصادی با ارزش- را داشت،.
اکنون وجود دارد. موجود با Sonnet 4.
6. این مدل همچنین پیشرفت عمدهای را در مهارتهای استفاده از رایانه در مقایسه با مدلهای قبلی Sonnet نشان.
میدهد. مانند هر مدل جدید کلود، ما ارزیابیهای ایمنی گستردهای را از Sonnet 4.
6 انجام داده ایم که بهطور کلی نشان میدهد که به همان اندازه،. یا ایمنتر از دیگر مدلهای Claude اخیر ما است.
محققان ایمنی ما به این نتیجه رسیدند که Sonnet 4. 6 «یک شخصیت کاملاً گرم،.
صادق،. اجتماعی،.
و گاهی اوقات خندهدار،. رفتارهای ایمنی بسیار قوی،.
و هیچ نشانهای از نگرانیهای عمده در مورد اشکال پرمخاطره ناهماهنگی دارد.» استفاده از رایانه تقریباً هر ی. نرمافزاری دارد که به راحتی نمیتوان آن را خودکار کرد:.
سیستمها و ابزارهای تخصصی که قبل از رابطهای مدرن مانند API ساخته شدهاند. برای اینکه هوش مصنوعی از چنین نرم افزاری استفاده کند، کاربران قبلاً مجبور بودند کانکتورهای سفارشی بسازند.
اما مدلی که میتواند از رایانه به روشی که شخص انجام میدهد استفاده کند،. این معادله را تغییر میدهد.
در اکتبر 2024،. ما اولین کسی بودیم که یک مدل استفاده از کامپیوتر همهمنظوره در آن زمان،.
ما نوشتیم که "هنوز آزمایشی بود - گاهی اوقات دست و پا گیر و مستعد خطا" بود،. اما ما انتظار بهبود سریع را داشتیم.
OSWorld،. معیار استاندارد برای استفاده از کامپیوتر هوش مصنوعی،.
نشان میدهد که مدلهای ما تا چه حد پیشرفت کردهاند. صدها کار را در نرم افزار واقعی (Chrome،.
LibreOffice،. VS Code،.
و موارد دیگر) که روی یک کامپیوتر شبیهسازی شده اجرا میشوند،. ارائه میدهد.
هیچ رابط برنامهنویسی برنامهنویسی (API) یا رابطهای هدفمندی وجود ندارد. این مدل کامپیوتر را میبیند و با آن به همان شیوهای تعامل میکند که یک.
شخص انجام میدهد:. کلیک کردن روی ماوس (مجازی) و تایپ کردن روی یک صفحه کلید (مجازی).
در طول شانزده ماه، مدلهای Sonnet ما در OSWorld پیشرفتهای ثابتی داشته اند. پیشرفتها را میتوان فراتر از معیارها نیز مشاهده کرد: کاربران اولیه Sonnet 4.
6 قابلیتهای سطح انسانی را در کارهایی مانند پیمایش یک صفحه گسترده پیچیده یا پر کردن یک فرم. وب چند مرحلهای،.
قبل از جمعآوری همه آنها در چند مرحله مشاهده میکنند. این مدل مطمئناً هنوز از ماهرترین انسانها در استفاده از رایانه عقب است.
اما نرخ پیشرفت با این وجود قابل توجه است. این بدان معناست که استفاده از رایانه برای طیف وسیعی از وظایف کاری بسیار مفیدتر است - و.
مدلهای بسیار توانمندتر در دسترس هستند. امتیازات قبل از کلود سونت 4.
5 در OSWorld اصلی اندازهگیری میشد. نمرات از Sonnet 4.
5 به بعد از OSWorld-Verified استفاده کنید. OSWorld-Verified (منتشر شده در ژوئیه 2025) یک ارتقاء درجا از معیار اصلی OSWorld است،.
با بهروزرسانیهایی برای کیفیت کار،. درجهبندی ارزیابی و زیرساخت.
در عین حال،. استفاده از رایانه خطراتی را به همراه دارد:.
عوامل مخرب میتوانند با پنهان کردن دستورالعملها در وبسایتها در آنچه بهعنوان حمله prompt شناخته میشود،. سعی کنند مدل را ربودند.
ما برای بهبود مقاومت مدلهایمان در برابر تزریق سریع کار کرده ایم - ارزیابیهای ایمنی ما نشان میدهد که. Sonnet 4.
6 یک پیشرفت بزرگ در مقایسه با آن است. نسخه قبلی، Sonnet 4.
5، و عملکردی مشابه Opus 4. 6 دارد.
میتوانید در مورد نحوه کاهش تزریق سریع و سایر نگرانیهای ایمنی در اسناد API ما اطلاعات بیشتری کسب. کنید.
با ارزیابی Claude Sonnet 4. 6 فراتر از استفاده از رایانه، Claude Sonnet 4.
6 در معیارها در سراسر صفحه بهبود یافته است. به هوش سطح Opus با قیمتی نزدیک میشود که آن را برای کارهای بسیار بیشتر کاربردیتر.
میکند. میتوانید بحث کاملی در مورد قابلیتهای Sonnet 4.
6 و رفتارهای مرتبط با ایمنی آن را در کارت سیستم ما بیابید. خلاصه و مقایسه با سایر مدلهای اخیر در زیر آمده است.
در کلود کد، آزمایش اولیه ما نشان داد که کاربران تقریباً 70 درصد مواقع Sonnet 4. 6 را به Sonnet 4.
کاربران گزارش دادند که قبل از اصلاح کد و منطق مشترک ادغام شده به جای تکرار آن،. متن را بهطور موثرتری میخواند.
این باعث شد که استفاده در جلسات طولانی نسبت به مدلهای قبلی کمتر خسته کننده باشد. حتی کاربران ترجیح میدادند 6 تا Opus 4.
5، مدل مرزی ما از نوامبر، 59 ٪ مواقع. آنها Sonnet 4.
6 را بهطور قابل توجهی کمتر مستعد مهندسی بیش از حد و "تنبلی" و بهطور معنیداری در پیروی. از آموزش بهتر ارزیابی کردند.
آنها ادعاهای نادرست کمتری در مورد موفقیت،. توهمات کمتر و پیگیری مداوم در کارهای چند مرحلهای را گزارش کردند.
پنجره زمینه 1M رمزی Sonnet 4. 6 برای نگهداری کل پایگاههای کد،.
قراردادهای طولانی،. یا دهها مقاله تحقیقاتی در یک درخواست کافی است.
مهمتر از همه، Sonnet 4. 6 بهطور موثر در تمام آن زمینه استدلال میکند.
این میتواند آن را در برنامهریزی افق بلند بسیار بهتر کند. ما این را بهویژه در ارزیابی Vending-Bench Arena مشاهده کردیم،.
که آزمایش میکند چگونه یک مدل میتواند یک کسبوکار (شبیهسازیشده) را در طول زمان اجرا کند – و. شامل عنصری از رقابت است که مدلهای هوش مصنوعی مختلف در مقابل یکدیگر قرار میگیرند تا بیشترین سود.
را به دست آورند. استراتژی جدید جالب:.
برای ده ماه اول شبیهسازی شده،. سرمایه گذاری زیادی روی ظرفیت انجام داد،.
بهطور قابل توجهی بیشتر از رقبای خود هزینه کرد،. و سپس به شدت روی سودآوری تمرکز کرد.
زمانبندی این محور به آن کمک کرد تا خیلی جلوتر از رقبا به پایان برسد. 6 با سرمایهگذاری زودهنگام روی ظرفیت،.
و سپس چرخش به سمت سودآوری در مرحله نهایی،. بهتر از Sonnet 4.
5 در Vending-Bench Arena عمل میکند. مشتریان اولیه نیز پیشرفتهای گستردهای را گزارش کردند، کد ظاهری و تحلیل مالی برجسته بودند.
مشتریان بهطور مستقل خروجیهای بصری Sonnet 4. 6 را بهطور قابل توجهی صیقلیتر،.
با چیدمانها،. انیمیشنها و حساسیت طراحی بهتر نسبت به مدلهای قبلی توصیف کردند.
مشتریان همچنین برای رسیدن به نتایج با کیفیت تولید به دورهای کمتری از تکرار نیاز داشتند. کلود سونت 4.
6 با عملکرد Opus 4. 6 در OfficeQA مطابقت دارد، که میزان خواندن یک مدل را اندازه میگیرد.
اسناد ی (نمودار، PDF، جداول)، حقایق و دلایل درست را از آن حقایق استخراج کنید. این یک ارتقای معنادار برای بارهای کاری درک اسناد است.
نسبت عملکرد به هزینه Claude Sonnet 4. 6 فوقالعاده است - نمیتوان گفت که مدلهای کلود در ماههای اخیر چقدر سریع در حال تکامل بودهاند.
6 نسبت به ارکستراسیون ما بهتر عمل میکند،. پیچیدهترین بارهای کاری ما را مدیریت میکند،.
و هر چه تنظیمات تلاش را بیشتر میکنید،. به بهبود ادامه میدهد.
6 پیشرفت قابل توجهی نسبت به Sonnet 4. 5 در سراسر صفحه است، از جمله وظایف افق طولانی و مشکلات دشوارتر.
به خصوص در خارج از کدهای پیچیده، Claude excelles در حال حاضر رفع شده است. زمانی که جستجو در پایگاههای کد بزرگ ضروری است.
برای تیمهایی که برنامهنویسی عاملی را در مقیاس اجرا میکنند،. شاهد نرخهای وضوح قوی و نوع سازگاری مورد نیاز توسعهدهندگان هستیم.
6 بهطور معنیداری نشان داده است. با Opus در تشخیص اشکال شکاف را کاهش داد،.
و به ما اجازه داد مرورگرهای بیشتری را به صورت موازی اجرا کنیم،. طیف وسیعتری از اشکالات را پیدا کنیم،.
و همه این کارها را بدون افزایش هزینه انجام دهیم. برای اولین بار،.
Sonnet استدلال سطح مرزی را با یک عامل کوچکتر و مقرون به صرفهتر ارائه میدهد. اگر کاربر سنگین Opus هستید، این یک جایگزین مناسب ارائه میکند.
6 بهطور معنی داری بازیابی پاسخ را در پشت محصول اصلی ما بهبود میبخشد - ما شاهد. جهش قابل توجهی در نرخ تطابق پاسخ در مقایسه با Sonnet 4.
5 در معیار خدمات مالی خود بودیم،. با یادآوری بهتر در جریان کاری خاصی که مشتریان ما به آنها وابسته هستند.
وظایف نمایندگی در اسناد ی واقعی این پیشرفتهای قابلتوجهی را نشان داد و از کلود سونت 4. 5 در پرسش و پاسخ استدلالی 15 درصد بهتر بود.
آن را به بالاترین عملکردی که برای استفاده از رایانه آزمایش کرده ایم تبدیل میکند. این نوع دقت برای جریانهای کاری مانند دریافت ارسال و اولین اطلاعیه از دست دادن بسیار مهم است.
6 نتایج سطح مرزی را در ساخت برنامههای پیچیده و رفع اشکال ارائه میدهد. این در حال تبدیل شدن به ما برای نوع کار مبتنی بر کد عمیق است که قبلاً به.
مدلهای گرانتری نیاز داشت. 6 بهترین کد iOS را که برای Rakuten AI آزمایش کرده ایم تولید کرد.
انطباق بهتر با مشخصات،. معماری بهتر،.
و به ابزار مدرنی که ما از آنها نخواستیم رسید،. همه در یک عکس.
نتایج واقعاً ما را شگفت زده کرد. غزل 4.
6 یک جهش قابل توجه به جلو در استدلال از طریق کارهای دشوار است. ما آن را به ویژه در وظایف شاخهای و چند مرحلهای مانند مسیریابی قرارداد،.
انتخاب الگوی شرطی و هماهنگی CRM قوی میدانیم - دقیقاً در جایی که مشتریان ما به حس قوی. و قابلیت اطمینان مدل نیاز دارند.
ما تحت تأثیر این قرار گرفته ایم با دقت کلود سونت 4. 6 استفاده پیچیده از رایانه را مدیریت میکند.
این یک پیشرفت واضح نسبت به هر چیز دیگری است که ما در ارزیابیهای خود آزمایش کرده ایم. 6 هنگام ساخت صفحات ظاهری و گزارشهای داده،.
طعم طراحی عالی دارد،. و برای رسیدن به آنجا نیاز به نگهداشتن بسیار کمتری نسبت به هر چیزی که قبلاً آزمایش کرده ایم.
دارد. و آمادهسازی نمایشگاه نتایج جستجو،.
تنها محتوای مرتبط را در زمینه نگه میدارد - هم کیفیت پاسخ و هم کارایی توکن را بهبود. میبخشد.
علاوه بر این،. اجرای کد،.
حافظه،. فراخوانی ابزار برنامهریزی،.
جستجوی ابزار،. و نمونههای استفاده از ابزار اکنون بهطور کلی در دسترس هستند.
6 عملکرد قوی را در هر تلاش فکری، حتی با تفکر طولانی، ارائه میدهد. بهعنوان بخشی از مهاجرت خود از Sonnet 4.
5،. توصیه میکنیم بسته به چیزی که میسازید،.
در سراسر طیف کاوش کنید تا تعادل ایده آل سرعت و عملکرد قابل اعتماد را بیابید. ما متوجه شدیم که Opus 4.
6 قویترین گزینه برای کارهایی است که به عمیقترین استدلال نیاز دارند،. مانند بازآفرینی پایگاه کد،.
هماهنگ کردن چندین عامل در یک گردش کار،. و مشکلاتی است که در حال حاضر برای کاربران اکسل به درستی اضافه میکنیم.
از اتصال دهندههای MCP پشتیبانی میکند و به کلود اجازه میدهد با ابزارهای دیگری که. روزانه استفاده میکنید،.
مانند S&P Global،. LSEG،.
کار کند. Daloopa، PitchBook، Moody's و FactSet.
میتوانید از کلود بخواهید بدون اینکه اکسل را ترک کند، متن را از خارج از صفحهگستردهتان بکشد. اگر قبلاً کانکتورهای MCP را در Claude.
ai راهاندازی کرده اید، همان اتصالات بهطور خودکار در اکسل کار میکنند. این در برنامههای Pro، Max، Team و Enterprise در دسترس است.
نحوه استفاده از Claude Sonnet 4. 6Claude Sonnet 4.
6 اکنون در همه طرحهای Claude،. Claude Cowork،.
Claude Code،. API ما و همه پلتفرمهای ابری اصلی در دسترس است.
ما همچنین سطح رایگان خود را بهطور پیشفرض به Sonnet 4. 6 ارتقا داده ایم — اکنون شامل ایجاد فایل، اتصال دهندهها، مهارتها و فشردهسازی میشود.
اگر توسعهدهنده هستید، میتوانید با استفاده از Claude-sonnet-4-6 از طریق Claude API به سرعت شروع کنید. شبکه شریک ما شبکه شریک کلود را راه اندازی میکنیم،.
برنامهای برای های شریک به شرکتها کمک میکنند تا کلود را بپذیرند. بیشتر بخوانید معرفی موسسه آنتروپیک ما در حال راهاندازی موسسه آنتروپیک هستیم،.
تلاشی جدید برای مقابله با مهمترین چالشهایی که هوش مصنوعی قدرتمند برای جوامع ما ایجاد میکند. بیشتر بخوانید.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
