TL;DR
- در داخل یک انبار غول پیکر خودمختار،.
- صدها ربات در حالی که اقلام را جمع آوری و توزیع میکنند تا یک جریان ثابت از.
- سفارشات مشتری را انجام دهند،.
چه اتفاقی افتاد
در داخل یک انبار غول پیکر خودمختار،. صدها ربات در حالی که اقلام را جمع آوری و توزیع میکنند تا یک جریان ثابت از.
سفارشات مشتری را انجام دهند،. راهروها را به سمت پایین پرتاب میکنند.
در این محیط شلوغ،. حتی ترافیکهای کوچک یا برخوردهای جزئی نیز میتواند منجر به کاهش سرعت شود.
برای جلوگیری از چنین بهمنی از ناکارآمدی،. محققان MIT و شرکت فناوری Symbotic روش جدیدی را توسعه دادند که بهطور خودکار ناوگان روباتها را.
به آرامیحرکت میدهد. روش آنها میآموزد که کدام رباتها باید در هر لحظه اول بروند،.
بر اساس نحوه شکل گیری تراکم،. و با اولویت دادن به روباتهایی که در شرف گیر افتادن هستند،.
سازگار میشود. به این ترتیب، سیستم میتواند رباتها را از قبل تغییر مسیر دهد تا از تنگناها جلوگیری کند.
سیستم ترکیبی از یادگیری تقویت عمیق،. یک روش هوش مصنوعی قدرتمند برای حل مشکلات پیچیده استفاده میکند تا بفهمد کدام رباتها باید در اولویت.
قرار گیرند. سپس،.
یک الگوریتم برنامهریزی سریع و قابل اعتماد دستورالعملها را به رباتها میدهد و آنها را قادر میسازد. تا در شرایط دائماً در حال تغییر به سرعت پاسخ دهند.
در شبیهسازیهای الهامگرفته از طرحبندیهای واقعی انبار تجارت الکترونیک،. این رویکرد جدید در مقایسه با روشهای دیگر حدود ۲۵ درصد افزایش توان عملیاتی را به دست آورد.
نکته مهم این است که این سیستم میتواند به سرعت با محیطهای جدید با مقادیر مختلف ربات یا. طرحبندی انبارهای متنوع سازگار شود.
«مشکلات تصمیمگیری زیادی در تولید و تدارکات وجود دارد که شرکتها بر الگوریتمهای طراحیشده توسط متخصصان انسانی تکیه. میکنند.
اما ما نشان داده ایم که با قدرت تقویت عمیق،. میتوانیم به این رویکرد فوقالعادهای دست پیدا کنیم،.
زیرا میتوانیم به این رویکرد فوقالعادهای دست پیدا کنیم. هان ژنگ،.
دانشجوی فارغ التحصیل در آزمایشگاه اطلاعات و سیستمهای تصمیمگیری (LIDS) در MIT و نویسنده اصلی مقاله. ای در مورد این رویکرد جدید.
ژنگ توسط Yining Ma، یک فوق دکترای LIDS بر روی کاغذ پیوست. براندون آراکی و جینگکای چن از Symbotic; و نویسنده ارشد کتی وو،.
دانشیار توسعه شغلی در سال 1954 در مهندسی عمران و محیط زیست (CEE) و موسسه داده،. سیستمها و جامعه (IDSS) در MIT،.
و عضو LIDS. این تحقیق امروز در مجله تحقیقات هوش مصنوعی ظاهر میشود.
مسیریابی مجدد روباتها هماهنگی همزمان صدها ربات در یک انبار تجارت الکترونیکی کار سادهای نیست. این مشکل به ویژه پیچیده است زیرا انبار یک محیط پویا است و روباتها پس از رسیدن.
به اهداف خود بهطور مداوم وظایف جدیدی دریافت میکنند. آنها باید در حین خروج و ورود به طبقه انبار به سرعت هدایت شوند.
شرکتها اغلب از الگوریتمهای نوشته شده توسط متخصصان انسانی برای تعیین مکان و زمان حرکت روبات. ها استفاده میکنند تا تعداد بستهها را به حداکثر برسانند.
آنها میتوانند از پس آن برآیند. اما اگر ازدحام یا تصادم وجود داشته باشد،.
یک شرکت ممکن است چارهای نداشته باشد جز اینکه کل انبار را برای ساعتها تعطیل کند تا به. صورت دستی مشکل را برطرف کند.
"در این تنظیمات، ما پیشبینی دقیقی از آینده نداریم. ما فقط میدانیم آینده چه چیزی ممکن است،.
از نظر بستههایی که وارد میشوند یا توزیع سفارشات آتی،. بهعنوان سیستم برنامهریزی سازگار با این تغییرات،.
تغییر کند. محققان MIT با استفاده از یادگیری ماشینی به این سازگاری دست یافتند.
آنها با طراحی یک مدل شبکه عصبی شروع کردند تا مشاهدات محیط انبار را انجام دهند و تصمیم. بگیرند که چگونه رباتها را اولویتبندی کنند.
آنها این مدل را با استفاده از یادگیری تقویتی عمیق آموزش میدهند،. روشی آزمون و خطا که در آن مدل یاد میگیرد رباتها را در شبیهسازیهایی.
که از انبارهای واقعی تقلید میکنند،. کنترل کند.
این مدل برای تصمیمگیریهایی که بهطور کلی افزایش مییابد،. پاداش میگیرد با گذشت زمان،.
شبکه عصبی یاد میگیرد که بسیاری از رباتها را بهطور مؤثر هماهنگ کند. «با تعامل با شبیهسازیهای الهامگرفته از طرحبندی انبار واقعی،.
سیستم ما بازخوردی را دریافت میکند که ما از آن برای هوشمندتر کردن تصمیمگیریاش استفاده میکنیم. سپس شبکه عصبی آموزشدیده میتواند با انبارهایی با طرحبندیهای مختلف سازگار شود،.
ژنگمدت را با طرحبندیهای طولانیمدت طراحی میکند.» موانع موجود در مسیر هر ربات،. در حالی که تعاملات پویا بین رباتها را در حین حرکت در انبار در نظر میگیرد.
با پیشبینی تعاملات فعلی و آینده ربات، مدل برنامهریزی میکند تا از تراکم قبل از وقوع جلوگیری کند. پس از اینکه شبکه عصبی تصمیم گرفت که کدام روباتها باید اولویت داشته باشند،.
سیستم از یک الگوریتم برنامهریزی آزمایششده و واقعی برای هر ربات استفاده میکند. این الگوریتم کارآمد به رباتها کمک میکند تا به سرعت واکنش نشان دهند تغییر محیط انبار.
این ترکیب از روشها کلیدی است. "این رویکرد ترکیبی بر اساس کار گروه من در مورد چگونگی دستیابی به بهترین هر دو جهان بین.
روشهای یادگیری ماشین و بهینهسازی کلاسیک است. روشهای یادگیری ماشینی خالص هنوز برای حل مسائل پیچیده بهینهسازی تلاش میکنند،.
و با این حال،. طراحی روشهای موثر برای متخصصان انسانی بسیار زمانبر و زمان بر است.
Wu. غلبه بر پیچیدگی هنگامیکه محققان شبکه عصبی را آموزش دادند،.
سیستم را در انبارهای شبیهسازی شده آزمایش کردند که با انبارهایی که در طول آموزش دیده بودند. متفاوت بود.
از آنجایی که شبیهسازیهای صنعتی برای این مشکل پیچیده بسیار ناکارآمد بودند،. محققان محیطهای خود را طوری طراحی کردند که از آنچه در انبارهای واقعی اتفاق میافتد تقلید کنند.
بهطور متوسط،. ترکیبی از آنها رویکرد مبتنی بر یادگیری 25 درصد توان عملیاتی بیشتری نسبت به الگوریتمهای سنتی و همچنین.
یک روش جستجوی تصادفی،. از نظر تعداد بستههای تحویلشده به ازای هر ربات،.
به دست آورد. ژنگ میگوید:.
«بهویژه زمانی که تراکم رباتها در انبار افزایش مییابد،. پیچیدگی به صورت تصاعدی مقیاس میشود و این روشهای سنتی به سرعت شروع به از بین رفتن میکنند.
در این محیطها، روش ما بسیار کارآمدتر است،» ژنگ میگوید: در این محیطها، روش ما بسیار کارآمدتر است. در اتوماسیون انبار، یک رویکرد هدایتشده توسط یادگیری ماشینی است.
در آینده،. محققان میخواهند تکالیف وظایف را در فرمولبندی مسئله بگنجانند،.
زیرا تعیین اینکه کدام ربات هر کار را تکمیل میکند بر ازدحام تأثیر میگذارد. برنامهریزی هم میکنند تا سیستم خود را به انبارهای بزرگتر با هزاران ربات ارتقا دهند.
این تحقیق توسط Symbotic تأمین مالی شده است.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
