TL;DR
- چکیده:.
- این مقاله یادگیری تقویتی پیش بینی شده (ARL) را معرفی میکند،.
- یک چارچوب جدید که برای پر کردن شکاف بین فرآیندهای تصمیمگیری غیرمارکوویی و معماریهای کلاسیک یادگیری.
چه اتفاقی افتاد
چکیده:. این مقاله یادگیری تقویتی پیش بینی شده (ARL) را معرفی میکند،.
یک چارچوب جدید که برای پر کردن شکاف بین فرآیندهای تصمیمگیری غیرمارکوویی و معماریهای کلاسیک یادگیری. تقویتی،.
بهطور خاص تحت محدودیت یک مسیر مشاهده شده طراحی شده است. در محیطهایی که با پرش انتشار و گسستهای ساختاری مشخص میشوند،.
روشهای سنتی مبتنی بر حالت اغلب در گرفتن هندسه وابسته به مسیر ضروری مورد نیاز برای آیندهنگاری دقیق. شکست میخورند.
ما این مشکل را با بالا بردن فضای حالت به یک منیفولد افزایش یافته با امضا حل می. کنیم،.
جایی که تاریخچه فرآیند بهعنوان یک مختصات دینامیکی تعبیه شده است. با استفاده از یک رویکرد میدانی خودسازگار،.
نماینده یک پروکسی پیشبینیشده از قانون مسیر آینده را حفظ میکند و امکان ارزیابی قطعی بازده مورد انتظار. را فراهم میکند.
این انتقال از انشعاب تصادفی به خطی تک گذر ارزیابی بهطور قابل توجهی پیچیدگی و واریانس محاسباتی را. کاهش میدهد.
ما ثابت میکنیم که این چارچوب خواص انقباض اساسی را حفظ میکند و تعمیم پایدار را حتی در. حضور نویز دم سنگین تضمین میکند.
نتایج ما نشان میدهد که با پایهگذاری یادگیری تقویتی در ویژگیهای توپولوژیکی فضای مسیر،. عوامل میتوانند به مدیریت ریسک فعال و پایداری سیاست برتر در محیطهای بسیار فرار و زمان پیوسته دست.
یابند. یادگیری ماشین (cs.
LG)؛ مالی ریاضی (q-fin. MF); قیمت گذاری اوراق بهادار (q-fin.
PR); امور مالی آماری (q-fin. ST) استناد بهعنوان: (یا v1 [cs.
LG] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Daniel Bloch [مشاهده ایمیل] [v1] دوشنبه،. 6 آوریل 2026،.
13:. 15:.
44 UTC (57 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
