TL;DR
- چکیده:.
- وقتی عامل A به عامل B،.
- که ابزار C را از طرف کاربر X فراخوانی میکند،.
چه اتفاقی افتاد
چکیده:. وقتی عامل A به عامل B،.
که ابزار C را از طرف کاربر X فراخوانی میکند،. نمایندگی میکند،.
هیچ چارچوب موجود نمیتواند پاسخ دهد:. زنجیره مجوز چه کسی منجر به این عمل شده است،.
و کجا خطمشی را نقض کرده است؟ این مقاله SentinelAgent را معرفی میکند،.
چارچوبی رسمیبرای زنجیرههای نمایندگی قابل تأیید در سیستمهای هوش مصنوعی چند عامله فدرال. حساب زنجیره تفویض (DCC) هفت ویژگی را تعریف میکند - شش ویژگی قطعی (محدود کردن اعتبار،.
حفظ خط مشی،. بازسازیپذیری پزشکی قانونی،.
مهار آبشاری،. انطباق دامنه-عمل،.
انطباق طرحواره خروجی) و یک احتمالی (حفظ قصد) - با چهار فرضیه فراقضیهای غیرقابل اثبات عملی. پروتکل Intent-Preserving Delegation (IPDP) هر هفت ویژگی را در زمان اجرا از طریق یک سرویس غیر LLM Delegation.
Authority اجرا میکند. یک سه امتیاز چرخه حیات تأیید به 100 ٪ TPR ترکیبی در 0 ٪ FPR در DelegationBench نسخه.
4 (516 سناریو،. 10 دسته حمله،.
13 دامنه فدرال) میرسد. تحت شرایط خصمانه جعبه سیاه، DAS حملات 30/30 را با 0 مثبت کاذب مسدود میکند.
خواص قطعی تحت آزمایش تنش خصمانه نشکن هستند. راستیآزمایی قصد در برابر تفسیر پیچیده به 13 درصد کاهش مییابد.
تنظیم دقیق مدل NLI در 190 نمونه هیئت دولتی، P2 را از 1. 7 ٪ به 88.
3 ٪ TPR (5 برابر اعتبار متقاطع، F1 = 82. 1 ٪) بهبود میبخشد.
ویژگیهای P1، P3-P7 به صورت مکانیکی از طریق بررسی مدل TLA+ در 2. 7 میلیون ایالت با هیچ تخلفی تأیید میشوند.
حتی زمانی که از راستیآزمایی قصد اجتناب میشود،. شش ویژگی باقیمانده حریف را به فراخوانهای مجاز API،.
خروجیهای سازگار،. اقدامات قابل ردیابی،.
آبشارهای محدود و رفتار سازگار محدود میکنند. صفحه، 2 شکل، 9 جدول.
شامل تأیید مکانیکی TLA+،. معیار DelegationBench v4 (516 سناریو)،.
ادغام عامل زنده LangChain،. و ارزیابی مستقل از تیم قرمز رمزنگاری و امنیت (cs.
CR)؛ هوش مصنوعی (cs. AI)؛ سیستمهای چندعاملی (cs.
MA) استناد بهعنوان: (یا v1 [cs. CR] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. KrishnaSaiReddy Patil [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. 06:.
25:. 18 UTC (27 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
