TL;DR
- 5 آگوست 2025 به gpt-oss OpenAI خوش آمدید!
- Ollama با OpenAI شریک میشود تا جدیدترین مدلهای وزن باز پیشرفته خود را به Ollama بیاورد.
- دو مدل،.
چه اتفاقی افتاد
5 آگوست 2025 به gpt-oss OpenAI خوش آمدید! Ollama با OpenAI شریک میشود تا جدیدترین مدلهای وزن باز پیشرفته خود را به Ollama بیاورد.
دو مدل،. 20B و 120B،.
یک تجربه کاملاً جدید از چت محلی را به ارمغان میآورند و برای استدلال قدرتمند،. وظایف نمایندگی و موارد استفاده همهکاره از توسعهدهندگان طراحی شدهاند.
ویژگیهای برجسته قابلیتهای عامل:. از قابلیتهای بومیمدلها برای فراخوانی تابع،.
مرور وب (Ollama یک جستجوی داخلی ارائه میدهد که میتواند به صورت اختیاری برای تقویت مدل با آخرین. اطلاعات فعال شود)،.
فراخوانی ابزار پایتون و خروجیهای ساختاریافته. زنجیره کامل فکر: دسترسی کامل به فرآیند استدلال مدل، تسهیل اشکالزدایی آسانتر و افزایش اعتماد به خروجیها.
تلاش استدلال قابل تنظیم:. به راحتی تلاش استدلال (کم،.
متوسط،. زیاد) را بر اساس موارد استفاده خاص و نیازهای تأخیر تنظیم کنید.
با تنظیم دقیق:. مدلها را بهطور کامل با استفاده از موارد خاص خود از طریق تنظیم دقیق پارامترها سفارشی کنید.
مجوز Apache 2. 0 مجاز:.
آزادانه بدون محدودیت کپیلفت یا خطر ثبت اختراع بسازید - ایدهآل برای آزمایش،. سفارشیسازی و استقرار تجاری.
Quantization - فرمت MXFP4 OpenAI از کوانتیزاسیون برای کاهش ردپای حافظه مدلهای gpt-oss استفاده میکند. این مدلها با کمیسازی وزنهای ترکیبی متخصصان (MoE) به فرمت MXFP4، که در آن وزنها به 4.
25 بیت در هر پارامتر کوانتیزه میشوند، آموزش داده میشوند. وزنهای MoE مسئول 90+ درصد از کل تعداد پارامترها هستند،.
و کمیکردن آنها به MXFP4 باعث میشود که مدل کوچکتر روی سیستمهایی با کمتر از 16 گیگابایت. حافظه اجرا شود و مدل بزرگتر روی یک GPU 80 گیگابایتی قرار بگیرد.
Ollama از فرمت MXFP4 به صورت بومیو بدون کوانتیزاسیون یا تبدیل اضافی پشتیبانی میکند. هستههای جدیدی برای موتور جدید Olama توسعه داده شده اند تا از فرمت MXFP4 پشتیبانی کنند.
اولاما با OpenAI همکاری کرد تا در مقایسه با پیادهسازیهای مرجع آنها،. اطمینان حاصل کند که پیادهسازیهای اوللاما کیفیت یکسانی دارند.
مدل پارامتر 20B مدل gpt-oss-20b برای موارد استفاده با تأخیر کمتر، محلی یا تخصصی طراحی شده است. مدل پارامتر 120B مدل gpt-oss-120b برای تولید، اهداف عمومی، موارد استفاده با استدلال بالا طراحی شده است.
NVIDIA و Olama برای سرعت بخشیدن به gpt-oss در پردازندههای گرافیکی GeForce RTX و RTX PRO همکاری میکنند. NVIDIA و Olama شراکت خود را برای تقویت عملکرد مدل در پردازندههای گرافیکی NVIDIA GeForce RTX و RTX.
PRO پیش میبرند. این همکاری به کاربران رایانههای شخصی مجهز به RTX امکان میدهد تا از قابلیتهای مدل gpt-oss OpenAI بهطور.
دقیق استفاده کنند. ما به همکاری و ارتقای اولاما ادامه خواهیم داد.
در آینده، یک پست مهندسی عمیق در مورد مدل منتشر خواهیم کرد. شروع کنید با دانلود آخرین نسخه Olama شروع کنید این مدل را میتوان مستقیماً در برنامه جدید.
Olama's یا از طریق ترمینال بارگیری کرد:. اوللاما gpt-oss:.
20b را اجرا کنید اوللاما gpt-oss:. 120b را اجرا کنید مرجع وبلاگ راه اندازی OpenAI کارت مدل OpenAI وبلاگ NVIDIA RTX.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
