TL;DR
- محققان MIT بیش از یک دهه را صرف مطالعه تکنیکهایی کردهاند که رباتها را قادر میسازد تا اشیاء.
- پنهان را با «دیدن» از میان موانع پیدا کرده و دستکاری کنند.
- روشهای آنها از سیگنالهای بیسیم نافذ سطحی استفاده میکند که موارد پنهان را منعکس میکنند.
چه اتفاقی افتاد
محققان MIT بیش از یک دهه را صرف مطالعه تکنیکهایی کردهاند که رباتها را قادر میسازد تا اشیاء. پنهان را با «دیدن» از میان موانع پیدا کرده و دستکاری کنند.
روشهای آنها از سیگنالهای بیسیم نافذ سطحی استفاده میکند که موارد پنهان را منعکس میکنند. اکنون،.
محققان در حال استفاده از مدلهای هوش مصنوعی مولد برای غلبه بر تنگنای طولانی مدتی هستند که دقت. رویکردهای قبلی را محدود میکرد.
نتیجه روش جدیدی است که بازسازیهای دقیقتری شکل ایجاد میکند،. که میتواند توانایی ربات را برای بازیابی و دستکاری قابل اعتماد اشیایی که از دید مسدود شدهاند،.
بهبود بخشد. این تکنیک جدید بازسازی جزئی یک شی پنهان را از سیگنالهای بیسیم منعکسشده ایجاد میکند و قسمتهای گمشده.
شکل آن را با استفاده از یک سیستم هوش مصنوعی مولد آموزشدیده ویژه برای معرفی یک مدل هوش. مصنوعی مولد دقیق استفاده میکند.
اتاق، از جمله تمام مبلمان. این سیستم از سیگنالهای بیسیم ارسال شده از یک رادار ثابت استفاده میکند که حرکت انسان در فضا.
را منعکس میکند. این یک چالش کلیدی بسیاری از روشهای موجود را برطرف میکند،.
که نیازمند نصب حسگر بیسیم بر روی یک ربات متحرک برای اسکن محیط است. و برخلاف برخی از تکنیکهای رایج مبتنی بر دوربین،.
روش آنها حریم خصوصی افراد در محیط را حفظ میکند. این نوآوریها میتوانند رباتهای انبار را قادر میسازند تا اقلام بستهبندی شده را قبل از ارسال بررسی کنند.
و ضایعات حاصل از بازگرداندن محصول را حذف کنند. آنها همچنین میتوانند به روباتهای خانه هوشمند اجازه دهند موقعیت فردی را در یک اتاق درک کنند و.
ایمنی و کارایی تعامل انسان و ربات را بهبود بخشند. «کاری که ما اکنون انجام داده ایم توسعه مدلهای هوش مصنوعی مولد است که به ما در درک بازتابهای.
بیسیم کمک میکند. فاضل ادیب،.
دانشیار دپارتمان مهندسی برق و علوم کامپیوتر،. مدیر گروه سینتیک سیگنال در آزمایشگاه رسانه MIT و نویسنده ارشد دو مقاله در مورد این تکنیکها،.
میگوید:. «از توانایی پر کردن شکافهایی که قبلاً قادر به دیدن آن نبودیم تا توانایی تفسیر بازتابها و بازسازی.
کل صحنهها. و دستیار پژوهشی لارا دادز و همچنین دستیاران پژوهشی مایسی لام،.
و ییبو چنگ،. و در مقاله دوم توسط کایچن ژو،.
دستیار پژوهشی،. هر دو مقاله در کنفرانس IEEE در Respecularly.
استفاده از سیگنالهای موج میلی متری (mmWave) برای ایجاد دقیق بازسازی اشیاء سهبعدی که از دید. پنهان هستند،.
مانند کیف پول گمشدهای که زیر شمع دفن شده است. این امواج،.
که همان نوع سیگنالهای مورد استفاده در وای فای هستند،. میتوانند از موانع معمولی مانند دیوار خشک،.
پلاستیک و مقوا عبور کرده و اشیاء پنهان را منعکس کنند. اما امواج میلی متری معمولاً به شکلی خاص منعکس میشوند،.
که به معنای یک سطح منعکس میشود. بنابراین بخشهای بزرگی از سطح سیگنالها را به دور از حسگر mmWave منعکس میکند و آن مناطق را.
بهطور مؤثر نامرئی میکند. دادز توضیح میدهد:.
«وقتی میخواهیم یک شی را بازسازی کنیم،. فقط میتوانیم سطح بالایی را ببینیم و نمیتوانیم هیچ یک از پایین یا کنارهها را ببینیم.» محققان قبلاً.
از اصول فیزیک برای تفسیر سیگنالهای بازتابشده استفاده میکردند،. اما این باعث میشود که شکل جدید آنها بیش از حد باشد.
این محدودیت با استفاده از یک مدل هوش مصنوعی مولد برای پر کردن قطعات "اما چالش این است. که چگونه این مدلها را برای پر کردن این شکافها آموزش میدهید؟
" ادیب میگوید. معمولاً،.
محققان از مجموعه دادههای بسیار بزرگ برای آموزش یک مدل هوش مصنوعی مولد استفاده میکنند،. که یکی از دلایلی است که مدلهایی مانند کلود و لاما چنین عملکرد چشمگیری را نشان می.
دهند. اما هیچ مجموعه داده mmWave به اندازه کافی برای آموزش بزرگ نیست.
در عوض،. محققان تصاویر را در مجموعه دادههای بینایی کامپیوتری بزرگ برای تقلید از ویژگیهای بازتابهای mmWave تطبیق دادند.
"ما در حال شبیهسازی خاصیت specularity و نویز دریافتی از این بازتابها بودیم تا بتوانیم مجموعه دادههای موجود. را در دامنه خود اعمال کنیم.
سالها طول میکشید تا بتوانیم دادههای جدید کافی را برای انجام این کار جمعآوری کنیم. در این دادههای اقتباسشده،.
یک مجموعه داده مصنوعی ایجاد میکنند که برای آموزش یک مدل هوش مصنوعی مولد برای انجام شکلهای قابل. قبول استفاده میکنند.
بازسازیها. سیستم کامل که Wave-Former نام دارد،.
مجموعهای از سطوح شی بالقوه را بر اساس بازتابهای میلیموج پیشنهاد میکند،. آنها را به مدل هوش مصنوعی مولد تغذیه میکند تا شکل را تکمیل کند،.
و سپس سطوح را تا زمانی که به بازسازی کامل دست یابد،. اصلاح میکند.
20 درصد بیش از خطوط پایه پیشرفته. این اشیاء در پشت یا زیر مقوا، چوب، دیوار خشک، پلاستیک و پارچه پنهان شده بودند.
دیدن "ارواح" تیم از همین رویکرد برای ساختن یک سیستم توسعه یافته استفاده کرد که تمام صحنههای. داخلی را با استفاده از انعکاس mmWave از انسان در حال حرکت در اتاق بهطور کامل بازسازی می.
کند. حرکت انسان بازتابهای چند مسیری ایجاد میکند.
برخی از امواج میلیمتری از انسان منعکس میشوند،. سپس دوباره از دیوار یا شی منعکس میشوند و سپس به حسگر بازمیگردند.
توضیح میدهد. این بازتابهای ثانویه به اصطلاح «سیگنالهای شبح» را ایجاد میکنند که کپیهایی از سیگنال اصلی منعکس میشوند که.
با حرکت انسان مکان را تغییر میدهند. این سیگنالهای ارواح معمولاً بهعنوان نویز کنار گذاشته میشوند، اما اطلاعاتی درباره چیدمان اتاق نیز دارند.
"با تجزیه و تحلیل این که چگونه این بازتابها در طول زمان تغییر میکنند،. میتوانیم درک دقیقی از محیط اطراف خود به دست آوریم.
اما تلاش برای تفسیر مستقیم این سیگنالها از نظر دقت و وضوح محدود خواهد بود. " دادز میگوید:.
آنها از یک روش آموزشی مشابه برای آموزش یک مدل هوش مصنوعی مولد برای تفسیر بازسازیهای صحنه درشت. و درک رفتار بازتابهای چندمسیری mmWave استفاده کردند.
این مدل شکافها را پر میکند و بازسازی اولیه را تا زمانی که صحنه را کامل کند،. اصلاح میکند.
آنها سیستم بازسازی صحنه خود را که RISE نامیده میشود،. با استفاده از بیش از 100 مسیر انسانی که توسط یک عکس گرفته شده بود،.
آزمایش کردند. رادار mmWave بهطور متوسط،.
RISE بازسازیهایی ایجاد کرد که تقریباً دو برابر دقیقتر از تکنیکهای موجود بودند. در آینده، محققان میخواهند جزئیات و جزئیات را در بازسازیهای خود بهبود بخشند.
آنها همچنین میخواهند مدلهای پایه بزرگی برای سیگنالهای بیسیم بسازند،. مانند مدلهای پایه GPT،.
کلود،. و جمینی برای زبان و بینایی،.
که میتواند برنامههای جدیدی را باز کند. این کار تا حدی توسط بنیاد ملی علوم (NSF)، آزمایشگاه رسانهای MIT و آمازون پشتیبانی میشود.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
