TL;DR
- v2 نوع اعلام:.
- جایگزین چکیده:.
- تخمین دقیق ارتباط پرس و جو برای رتبهبندی و تبدیل تجارت الکترونیک حیاتی است.
چه اتفاقی افتاد
v2 نوع اعلام:. جایگزین چکیده:.
تخمین دقیق ارتباط پرس و جو برای رتبهبندی و تبدیل تجارت الکترونیک حیاتی است. در حالی که مدلهای زبان بزرگ (LLM) در استدلال برتری دارند،.
اغلب فاقد دانش تخصصی مورد نیاز برای پرسوجوهای طولانیمدت یا سریع در حال تکامل هستند،. که نیاز به بازیابی-افزایش نسل (RAG) دارد.
با این حال،. محیطهای تولید با سه چالش حیاتی روبرو هستند:.
(1) زمینه خارجی ذاتاً پر سر و صدا و ناسازگار است. (2) بودجه تأخیر شدید، پردازش یا پالایش چند مرحلهای را ممنوع میکند.
و (3) مدل باید بهطور همزمان ارتباط و اعتماد زمینه را در یک پاس استنتاج یکپارچه ارزیابی کند. ما DyKnow-RAG را پیشنهاد میکنیم،.
یک چارچوب یادگیری تقویتی که به LLMها یاد میدهد تا از طریق استفاده پویا از دانش. خارجی اعتماد کنند.
DyKnow-RAG که بر اساس بهینهسازی خط مشی نسبی گروه (GRPO) ساخته شده است،. از استراتژی عرضه دو گروهی استفاده میکند.
(فقط پارامتری در مقابل با زمینه) و یک مکانیسم مقیاسبندی مزیت بین گروهی مبتنی بر عقب. این مدل را قادر میسازد تا استفاده از زمینه را بدون ی فرآیند انسانی یا سربار استنتاج.
اضافی بهینه کند. خط لوله ما بیشتر زنجیره فکری ساختاریافته (CoT) و یک استخر RL با اولویت عدم قطعیت را برای.
تثبیت آموزش ادغام میکند. ارزیابیهای آفلاین دستاوردهای Macro-F1 و دقت قابلتوجهی را نشان میدهند،.
به ویژه در بخشهای پرس و جو حساس به نویز. نکته مهم این است که DyKnow-RAG در سیستم تولید Taobao مستقر شده است و به صدها میلیون کاربر.
فعال و میلیاردها درخواست جستجوی روزانه خدمات ارائه میدهد. تستهای کنترلشده A/B افزایش ثابتی را در معیارهای کلیدی کسبوکار،.
از جمله GSB و Item Goodrate نشان میدهند،. در حالی که تأخیر p99 را زیر 400 میلیثانیه حفظ میکنند.
این کار یک پارادایم مقیاس پذیر و قابل استقرار برای عملیاتی کردن RAG پر سر و صدا تحت. محدودیتهای کارایی شدید در مقیاس بزرگ ارائه میدهد.
جستجوی صنعتی.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
