LangChain Blogمعتبر1405/01/16 21:46محصول و صنعت

یادگیری مستمر برای عوامل هوش مصنوعی

کنید)،. کنید. عامل انجام داد.

منبع: LangChain Blog

محصول و صنعت متن‌باز و جامعه پژوهش پیشرفته

نسخه مطالعهعمومی

منبعLangChain Blog

انتشار1405/01/16 21:46

اشتراک در تلگرام اشتراک در X اشتراک در LinkedIn

share-ready · لینک کمپین آماده است

متن پیش‌نمایش telegram با ۳۵۱ کاراکتر ساخته شده است.

اگر این خبر برایتان مفید بود، حساب بسازید.

با حساب هوش‌گیت می‌توانید خبرها را ذخیره کنید، موضوع‌ها و چهره‌های تخصصی را دنبال کنید و مسیر یادگیری یا پروژه مناسب خودتان را سریع‌تر پیدا کنید.

ساخت حساب ورود برای ذخیره و دنبال‌کردن

پیگیری گفتگو

بازگشت سریع به همین گفتگو

این گفت‌وگو را ذخیره کن، آن را دنبال کن و اگر لازم است یک یادداشت کوتاه برای بازگشت بعدی بگذار.

لایه انسانی

نویسنده انسانی، یادداشت کارشناس و شفافیت نویسندگی

این سطح مشخص می‌کند کجا انتشار با حضور انسان تقویت شده و کجا newsroom هوش مصنوعی هنوز نقش اصلی را دارد.

لایه newsroom با کمک هوش مصنوعیبدون author انسانی عمومیreview with confidence

این خبر فعلاً بیشتر در لایه newsroom و پوشش کمک‌گرفته از هوش مصنوعی قرار دارد و هنوز نویسنده انسانی مشخصی برای آن ثبت نشده است.

جانمایی امن برای اسپانسر

امتیاز جانمایی۷۰ / 100

یادداشت‌های انسانی۰

منبع در سطح trusted قرار دارد.
trust score منبع بالاست.

قدم بعدی

بعد از خواندن این خبر چه کار کنم؟

اگر این موضوع برایت مهم است، از همین‌جا آن را ذخیره کن، گفت‌وگو را دنبال کن یا به مسیر یادگیری، چهره تخصصی و پروژه مرتبط برو.

حفظ و پیگیری

این مقاله را برای بازگشت بعدی ذخیره کن، منبعش را دنبال کن یا وارد گفت‌وگوی همین خبر شو تا موضوع از دست نرود.

رفتن به گفت‌وگو

یادگیری و action بعدی

اگر می‌خواهی از خبر به فهم عمیق‌تر برسی، مسیرهای مرتبط زیر ساده‌ترین نقطه شروع‌اند.

رفتن به هاب یادگیری دیدن چهره تخصصی مرتبط پروژه مرتبط

راهنمای مطالعه

منبع اصلی، تاریخ فارسی و شاخص‌های سریع این خبر.

رفتن به منبع

تاریخ فارسی1405/01/16 21:46

داستانمستقل

نکات کلیدی

این باکس براساس سطح مطالعه شما (عمومی) تنظیم شده است.

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز است: به روز رسانی وزن مدل.
اما برای عوامل هوش مصنوعی، یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد: مدل، مهار و زمینه.
درک تفاوت، طرز فکر شما را در مورد ساختن سیستم‌هایی که در طول زمان بهبود می‌یابند، تغییر می‌دهد.
سه لایه اصلی سیستم‌های عامل عبارتند از: مدل: مدل وزن خود را دارد.
این به کدی اشاره دارد که عامل را هدایت می‌کند،.
و همچنین به هر دستورالعمل یا ابزاری که همیشه بخشی از هارنس هستند.
Context:.
زمینه اضافی (دستورالعمل‌ها،.

سیگنال تعامل

بازدید۰

کلیک۰

امتیاز0.00

دیدگاه۰

TL;DR

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز است: به روز رسانی وزن مدل.
اما برای عوامل هوش مصنوعی، یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد: مدل، مهار و زمینه.
درک تفاوت، طرز فکر شما را در مورد ساختن سیستم‌هایی که در طول زمان بهبود می‌یابند، تغییر می‌دهد.

چه اتفاقی افتاد

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز است: به روز رسانی وزن مدل. اما برای عوامل هوش مصنوعی، یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد: مدل، مهار و زمینه.

درک تفاوت، طرز فکر شما را در مورد ساختن سیستم‌هایی که در طول زمان بهبود می‌یابند، تغییر می‌دهد. سه لایه اصلی سیستم‌های عامل عبارتند از: مدل: مدل وزن خود را دارد.

این به کدی اشاره دارد که عامل را هدایت می‌کند،. و همچنین به هر دستورالعمل یا ابزاری که همیشه بخشی از هارنس هستند.

Context:. زمینه اضافی (دستورالعمل‌ها،.

مهارت‌ها) که خارج از هارنس زندگی می‌کند و می‌تواند برای پیکربندی آن استفاده شود. مثال شماره 1:.

نگاشت این یک عامل برنامه‌نویسی مانند Claude Code:. Model:.

claude-sonnet:. Claude-sonnet،.

و غیره /skills,. mcp.

json مثال شماره 2: نگاشت این به OpenClaw: Model: manyHarness: Pi + some دیگر زمینه‌های عامل داربست: SOUL. md، مهارت‌هایی از clawhub وقتی در مورد یادگیری مستمر صحبت می‌کنیم، اکثر مردم بلافاصله به سراغ مدل می‌روند.

اما در واقعیت - یک سیستم هوش مصنوعی می‌تواند در هر سه این سطوح یاد بگیرد. یادگیری مستمر در لایه مدل وقتی اکثر مردم در مورد یادگیری مستمر صحبت می‌کنند،.

این همان چیزی است که بیشتر به آن اشاره می‌کنند:. به‌روزرسانی وزن‌های مدل.

تکنیک‌های به‌روزرسانی این شامل SFT، RL (مانند GRPO) و غیره است. یک چالش اصلی در اینجا فاجعه‌آمیز است،.

زمانی که یک مدل کار جدید را فراموش می‌کند یا چیزهای جدیدی را به‌روزرسانی می‌کند. قبلا می‌دانستند این یک مشکل تحقیقاتی باز است.

وقتی افراد برای یک سیستم عامل خاص،. مدل‌های آموزشی انجام می‌دهند (مثلاً می‌توانید مدل‌های کدکس OpenAI را به‌عنوان آموزش‌دهی شده برای عامل Codex خود مشاهده.

کنید)،. تا حد زیادی این کار را برای سیستم عامل به‌عنوان یک کل انجام می‌دهند.

در تئوری،. می‌توانید این کار را در سطحی دقیق‌تر انجام دهید (مثلاً می‌توانید یک LORA برای هر کاربر داشته باشید).

اما در عمل این کار بیشتر در سطح عامل انجام می‌شود. همانطور که قبلاً تعریف شد،.

هارنس به کدی اشاره دارد که عامل را هدایت می‌کند،. و همچنین به هر دستورالعمل یا ابزاری که همیشه بخشی از مهار است.

با محبوبیت بیشتر هارنس‌ها، مقالات متعددی در مورد نحوه بهینه‌سازی هارنس‌ها صحبت شده است. یکی از اخیراً Optimization-End: Optim-H است.

مهارها. ** ایده اصلی این است که عامل در یک حلقه در حال اجرا است.

شما ابتدا آن را روی دسته‌ای از کارها اجرا می‌کنید و سپس آنها را ارزیابی می. کنید.

سپس تمام این گزارش‌ها را در یک سیستم فایل ذخیره می‌کنید. سپس یک عامل کدگذاری را اجرا می‌کنید تا به این ردیابی‌ها نگاه کند،.

و تغییراتی را در کد مهار پیشنهاد می‌دهد. مشابه یادگیری مداوم برای مدل‌ها، این کار معمولاً در سطح عامل انجام می‌شود.

در تئوری می‌توانید این کار را در سطحی دقیق‌تر انجام دهید (مثلاً یک مهار کد متفاوت برای هر. کاربر یاد بگیرید).

یادگیری مستمر در لایه زمینه "Context" خارج از مهار قرار دارد و می‌تواند برای پیکربندی آن استفاده. شود.

زمینه شامل مواردی مانند دستورالعمل‌ها، مهارت‌ها، حتی ابزارها است. معمولاً به این حافظه نیز گفته می‌شود.

همین نوع زمینه در داخل مهار نیز وجود دارد (به‌عنوان مثال،. مهار ممکن است دارای مهارت‌های سیستم پایه باشد).

تمایز این است که آیا بخشی از مهار است یا بخشی از پیکربندی. زمینه یادگیری را می‌توان در چندین سطح مختلف انجام داد.

زمینه یادگیری را می‌توان در سطح عامل انجام داد - عامل یک "حافظه" پایدار دارد و پیکربندی. خود را در طول زمان به روز می‌کند.

یک مثال عالی OpenClaw است که SOUL. md خود را دارد که در طول زمان به روز می‌شود.

زمینه یادگیری بیشتر در سطح مستاجر (کاربر،، تیم و غیره) انجام می‌شود. در این مورد هر مستاجر زمینه خود را دریافت می‌کند که در طول زمان به روز می.

شود. مثال‌ها عبارتند از Hex's Context Studio، Decagon's Duet، Sierra's Explorer.

شما می‌توانید همچنین ترکیب و مطابقت! بنابراین می‌توانید عاملی با به‌روزرسانی‌های زمینه سطح عامل، به‌روزرسانی‌های زمینه سطح کاربر، و به‌روزرسانی‌های زمینه سطح داشته باشید.

این به‌روزرسانی‌ها را می‌توان به دو روش انجام داد: بعد از آن در یک کار آفلاین. مشابه به‌روزرسانی‌های مهار - برای استخراج اطلاعات بینش و به‌روزرسانی زمینه، روی دسته‌ای از ردیابی‌های اخیر اجرا کنید.

این همان چیزی است که OpenClaw آن را "رؤیاپردازی" می‌نامد. در مسیر داغ به‌عنوان عامل در حال اجرا است.

عامل می‌تواند تصمیم بگیرد (یا کاربر می‌تواند از او بخواهد که) حافظه خود را در حین. کار بر روی وظیفه اصلی به روز کند.

بعد دیگری که در اینجا باید در نظر گرفت این است که به روز رسانی حافظه چقدر واضح. است.

آیا کاربر از عامل ترغیب می‌کند که به خاطر بسپارد،. یا عامل بر اساس دستورالعمل‌های اصلی در خود مهار به خاطر می‌آورد؟

مقایسه ردیابی‌ها هسته هستند همه این جریان‌ها توسط ردیابی‌ها تامین می‌شوند - مسیر اجرای کامل کاری که یک. عامل انجام داد.

LangSmith پلت فرم ما است که (از جمله موارد دیگر) به جمع آوری ردیابی‌ها کمک می‌کند. سپس می‌توانید از این ردیابی‌ها به روش‌های مختلف استفاده کنید.

اگر می‌خواهید مدل را به‌روزرسانی کنید،. می‌توانید ردیابی‌ها را جمع‌آوری کنید و سپس با شخصی مانند Prime Intellect برای آموزش مدل خود کار کنید.

اگر می‌خواهید مهار را بهبود بخشید،. می‌توانید از LangSmith CLI و LangSmith Skills استفاده کنید تا به یک عامل کدنویس اجازه دسترسی به این.

ردیابی‌ها را بدهید. این الگو نحوه بهبود Deep Agents (منبع‌باز،.

مدل آگنوستیک،. مهار پایه عمومی) را روی نیمکت ترمینال بهبود دادیم.

اگر می‌خواهید در طول زمان زمینه را بیاموزید (چه در سطح عامل،. کاربر،.

یا) - پس مهار عامل شما باید این را پشتیبانی کند. Deep Agents - مهار انتخابی ما - این را به روشی آماده تولید پشتیبانی می‌کند.

برای مثال‌هایی از نحوه انجام حافظه در سطح کاربر،. یادگیری پس‌زمینه و موارد دیگر،.

مستندات را در آنجا ببینید. به خبرنامه ما بپیوندید به روز رسانی‌های تیم و انجمن LangChain ایمیل خود را وارد کنید در.

حال پردازش درخواست شما. موفقیت آمیز!

لطفا صندوق ورودی خود را بررسی کنید و برای تایید اشتراک خود روی پیوند کلیک کنید. با عرض پوزش، مشکلی پیش آمد.

لطفا دوباره امتحان کنید.

چرا مهم است

اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیم‌گیری سازمانی اثر می‌گذارد.

منبع

لینک منبع اصلی در کارت و صفحه مقاله نمایش داده می‌شود.

اعتبار

چرایی اعتماد به این خبر

امتیاز اعتبار، منطق اعتماد، وضعیت راستی‌آزمایی و لاگ تغییرات در یک نگاه.

اعتبار خبر۴۳ / 100

اعتبار منبع۱۳ / 100

اعتبار موضوع۱۰۰ / 100

تازگی۴۴ / 100

مرحله عمر خبرNEEDS_UPDATE

نیاز به به‌روزرسانیبله

نیازمند تقویتنیازمند تقویتمرجع قوینیازمند بازبینینیازمند به‌روزرسانی

تصمیم انسانی تحریریه

خلاصه تصمیم تحریریه

سیگنال بازبینی باز استlearning-quality review requiredنیاز بازبینی قابل مشاهده استstandard editorial path

این مقاله در مسیر learning-quality review required قرار دارد و بخشی از سیگنال‌های review هنوز باید تکمیل یا شفاف‌تر شود.

دلیل انتشار: محتوای evergreen و آموزشی چون بعداً هم مرجع می‌شود، باید خوانایی، سطح‌بندی و next-stepهای دقیق داشته باشد. وضعیت فعلی: fact-check not_started و checklist ۰٪.

کلاس خبرEVERGREEN_LEARNING

سخت‌گیری بازبینیREQUIRED

بازبینثبت عمومی نشده

موارد بازبینی که باید شفاف‌تر شوند

تیتر بازبینی و حرفه‌ای شدخلاصه برای کارت و SEO تایید شدبدنه از نظر خوانایی و ساختار بازبینی شدنسخه‌های سطح‌بندی‌شده بررسی شدبازخوانی نهایی انجام شد

سیاست تحریریه و اصلاحات چرا به هوش‌گیت اعتماد کنیم؟

چرا این خبر قابل اعتماد است

شفافیت راستی‌آزمایی ادعاها

ادعای تاییدشده۰

نیازمند بازبینی۰

میانگین اطمینان۰٪

چرا هنوز مهم است

این خبر هنوز بازدید، کامنت یا follow-up کافی دارد و از چرخه توجه مخاطب خارج نشده است.

تقویت اعتبار

وجود follow-up و پوشش مرتبط، authority این خبر را در طول زمان تقویت می‌کند.

پیگیری به‌روزرسانی

این خبر evergreen است و برای حفظ authority به refresh تحریریه نیاز دارد.

بخش منابع و ارجاع‌ها

لینک‌های منبع اصلی، ارجاع‌های ادعا و referenceهای مکمل برای پیگیری مستقیم.

blog.langchain.comمنبع اصلی

blog.langchain.com/continual-learning-for-ai-agents/

blog.langchain.devارجاع تکمیلی

blog.langchain.dev

پوشش‌های پیگیری

پیگیری‌های بعدی، توضیح‌دهنده‌های مرتبط یا خبرهای مکملی که عمر این موضوع را بعد از انتشار ادامه می‌دهند.

مبانی استفاده حرفه‌ای از دستیارهای زبانی در تیم: از مسئله تا خروجی قابل اتکا

پیگیری بعدی

1405/02/02 01:42

چطور استفاده حرفه‌ای از دستیارهای زبانی در تیم را در یک جریان کار واقعی پیاده کنیم

پیگیری بعدی

1405/02/02 00:42

پیاده‌سازی استفاده حرفه‌ای از دستیارهای زبانی در تیم در محیط سازمانی

پیگیری بعدی

1405/02/01 23:42

ارزیابی استفاده حرفه‌ای از دستیارهای زبانی در تیم: از مبنا تا معیار پذیرش

پیگیری بعدی

1405/02/01 22:42

تعامل کاربران و کیفیت خبر

امتیاز بدهید، نظر ثبت کنید یا اگر خطایی دیدید گزارش اصلاح بفرستید. moderation، trust contributor و کیفیت thread به‌صورت شفاف نمایش داده می‌شود.

بازدید

کلیک روی خبر

امتیاز میانگین

0.00 / 5

دیدگاه تایید شده

وضعیت trust گفتگو

کیفیت thread براساس reputation contributorها، رأی‌ها و moderation سنجیده می‌شود.

در حال بارگذاری

امتیاز thread

۰ / 100

دیدگاه متخصص

دیدگاه مفید

خروجی moderation و قوانین

تاییدشده: ۰pending: ۰hidden/spam: ۰

حضور انسانی در این گفتگو

این بخش کمک می‌کند thread فقط حول personaها دیده نشود و contributorهای انسانی واقعی هم واضح باشند.

contributor انسانی: ۰trusted: ۰expert: ۰

هنوز contributor انسانی برجسته‌ای در این thread دیده نشده است.

امتیاز شما به خبر

هنوز امتیاز نداده‌اید.

واکنش سریع به خبر

به‌جای لایک کلی، نوع برداشت خودتان را مشخص کنید.

ثبت دیدگاه

دیدگاه‌های کم‌ارزش یا spam به‌صورت خودکار محدود می‌شوند و نتیجه moderation در همین صفحه قابل مشاهده است.

گزارش اصلاح یا بهبود

اگر claim، ترجمه، منبع یا framing خبر نیاز به اصلاح دارد، این مسیر مستقیم برای تیم تحریریه است.

آخرین دیدگاه‌ها

هنوز دیدگاهی ثبت نشده است.

مقایسه سه سطح مطالعه

برای همین خبر، نسخه ساده، عمومی و تخصصی کنار هم خلاصه شده‌اند.

ساده

۵٬۷۵۴ کاراکتر

مدل،. مهار و زمینه. کند،.

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز.
به روز رسانی وزن مدل.
اما برای عوامل هوش مصنوعی،.
یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد:.

عمومی

۵٬۸۷۶ کاراکتر

کنید)،. کنید. عامل انجام داد.

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز است: به روز رسانی وزن مدل.
اما برای عوامل هوش مصنوعی، یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد: مدل، مهار و زمینه.
درک تفاوت، طرز فکر شما را در مورد ساختن سیستم‌هایی که در طول زمان بهبود می‌یابند، تغییر می‌دهد.
سه لایه اصلی سیستم‌های عامل عبارتند از: مدل: مدل وزن خود را دارد.

تخصصی

۵٬۸۴۲ کاراکتر

زمینه یادگیری را می‌توان در سطح عامل انجام داد - عامل یک "حافظه" پایدار دارد و پیکربندی خود را در طول زمان به روز می‌کند. بنابراین می‌توانید عاملی با به‌روزرسانی‌های زمینه سطح عامل، به‌روزرسانی‌های زمینه سطح کاربر، و به‌روزرسانی‌های زمینه سطح داشته باشید. اگر می‌خواهید در طول زمان زمینه را بیاموزید (چه در سطح عامل، کاربر، یا) - پس مهار عامل شما باید این را پشتیبانی کند.

بیشتر بحث‌های یادگیری مستمر در هوش مصنوعی بر یک چیز متمرکز است: به روز رسانی وزن مدل.
اما برای عوامل هوش مصنوعی، یادگیری می‌تواند در سه لایه متمایز اتفاق بیفتد: مدل، مهار و زمینه.
درک تفاوت، طرز فکر شما را در مورد ساختن سیستم‌هایی که در طول زمان بهبود می‌یابند، تغییر می‌دهد.
سه لایه اصلی سیستم‌های عامل عبارتند از: مدل: مدل وزن خود را دارد.

هایلایت‌ها و یادداشت‌ها

متن دلخواه را در خبر انتخاب کنید و با یک کلیک هایلایت بزنید. فقط برای شما قابل مشاهده است.

برای استفاده از هایلایت و یادداشت، وارد حساب کاربری شوید.

منابع اولیه

لینک‌های اصلی این خبر، شامل منبع اصلی و ارجاع‌های claim panel.

کاوش این مقاله

از این خبر به موضوع، persona، درس، پروژه و مسیر یادگیری مرتبط برسید.

پرسش از هوش‌گیت

موضوع‌های این مقاله

محصول و صنعت متن‌باز و جامعه پژوهش پیشرفته آموزش و یادگیری

موجودیت‌های این مقاله

هنوز موجودیت ثبت‌شده‌ای برای این مقاله دیده نمی‌شود.

چهره‌های مرتبط

آتنا فرهیخته

رهبر تحول مهارت با تمرکز روی مدیریت، منابع انسانی و عملیات و ترجمه خبرهای AI به تصمیم‌های واقعی، قابل‌فهم و اجرایی.