TL;DR
- 29 اکتبر 2025 Ollama با OpenAI و ROOST (ابزارهای ایمنی آنلاین باز قوی) همکاری میکند تا آخرین.
- مدلهای استدلال gpt-oss-safeguard را برای انجام وظایف طبقه بندی ایمنی به کاربران ارائه دهد.
- مدلهای gpt-oss-safeguard در دو اندازه موجود هستند: 20B و 120B و بهطور مجاز تحت مجوز Apache 2.
چه اتفاقی افتاد
29 اکتبر 2025 Ollama با OpenAI و ROOST (ابزارهای ایمنی آنلاین باز قوی) همکاری میکند تا آخرین. مدلهای استدلال gpt-oss-safeguard را برای انجام وظایف طبقه بندی ایمنی به کاربران ارائه دهد.
مدلهای gpt-oss-safeguard در دو اندازه موجود هستند: 20B و 120B و بهطور مجاز تحت مجوز Apache 2. 0 مجوز دارند.
شروع کنید Ollama را دانلود کنید یک ترمینال باز کنید و مدل را اجرا کنید:. 20B:.
اوللاما gpt-oss-safeguard:. 20b را اجرا کنید 120B:.
اوللاما gpt-oss-safeguard:. 120b را اجرا کنید نکات برجسته برای استدلال در مورد ایمنی آموزش دیده و تنظیم شده است تا.
استدلال ایمنی را برای موارد استفاده مانند فیلتر ورودی-خروجی LLM،. برچسبگذاری محتوای آنلاین و برچسبگذاری آفلاین برای موارد استفاده اعتماد و ایمنی تنظیم کند.
خطمشی خود را بیاورید:. خطمشی نوشتهشده شما را تفسیر میکند،.
بنابراین با حداقل مهندسی،. محصولات و موارد استفاده را تعمیم میدهد.
تصمیمات مستدل،. نه فقط امتیازها:.
دسترسی کامل به فرآیند استدلال مدل،. تسهیل اشکال زدایی آسانتر و افزایش اعتماد به تصمیمات خط مشی.
به خاطر داشته باشید که Raw CoT برای توسعه دهندگان و متخصصان ایمنی در نظر گرفته شده است. برای قرار گرفتن در معرض کاربران عمومییا استفاده از موارد خارج از زمینههای ایمنی در نظر.
گرفته نشده است. تلاش استدلال قابل تنظیم:.
به راحتی تلاش استدلال (کم،. متوسط،.
زیاد) را بر اساس موارد استفاده خاص و نیازهای تأخیر تنظیم کنید. مجوز مجاز Apache 2.
0:. ساخت آزادانه بدون محدودیتهای کپی لفت یا خطر ثبت اختراع - ایده آل برای آزمایش،.
سفارشی سازی و استقرار تجاری نتایج عملکرد OpenAI مدلهای حفاظتی gpt-oss را در مجموعههای ارزیابی داخلی و خارجی. ارزیابی کرد.
در ارزیابی داخلی، OpenAI چندین سیاست را بهطور همزمان برای حفاظت از gpt-oss در زمان استنتاج ارائه کرد. برای هر ورودی تست،.
OpenAI ارزیابی کرد که آیا gpt-oss-safeguard به درستی متن را تحت همه خطمشیهای موجود طبقهبندی میکند یا خیر. این یک کار چالش برانگیز است - این مدل تنها در صورتی دقیق حساب میشود که دقیقاً با.
ی مجموعه طلایی برای همه خطمشیهای گنجانده شده مطابقت داشته باشد. OpenAI بیشتر این مدلها را بر اساس مجموعه دادههای تعدیل که با مقاله تحقیقاتی ۲۰۲۲ خود منتشر کردند.
و در ToxicChat،. یک معیار عمومیبر اساس درخواستهای کاربر به یک ربات چت منبعباز،.
ارزیابی کرد. «gpt-oss-safeguard اولین مدل استدلال منبعباز با «خودت را بیاور» است سیاستها و تعاریف طراحی آسیبها.
شایسته مطالعه آزادانه،. اصلاح هستند و از فناوریهای حیاتی ایمنی استفاده کنید و قادر به نوآوری باشید.
در آزمایش ما اینطور بود در درک سیاستهای مختلف،. توضیح استدلال و نشان دادن آن مهارت دارد تفاوتهای ظریف در اعمال سیاستها،.
که معتقدیم برای سازندگان و سازندگان مفید خواهد بود تیمهای ایمنی.» - Vinay Rao،. مدیر ارشد فناوری ROOST درباره ROOST (ابزارهای ایمنی آنلاین باز قوی) *ROOST یک غیرانتفاعی است که بر ارائه.
ابزارهای ایمنی در دسترس،. با کیفیت بالا و منبعباز برایهای دیجیتال از همه نوع در عصر هوش مصنوعی متمرکز شده.
است. ROOST که در سال 2025 توسط گروه متنوعی از شرکتهای فناوری پیشرو،.
های بشردوستانه و مؤسسات دانشگاهی تأسیس شد،. معتقد است که راهحلهای ایمنی آنلاین را میتوان با ارائه ابزارهای متن باز و پشتیبانی فنی نوآورانه به.
ها به بهترین وجه به دست آورد. مرجع وبلاگ OpenAI کتاب آشپزی توسعه دهنده OpenAI gpt-oss-safeguard مخزن جامعه مدل ROOST در GitHub.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
