مایکروسافت از چت جی پی تی (ChatGPT) برای شروع تعامل انسان با پهپادها استفاده می کند
ممکن است تا به حال توانایی های شگفت انگیز هوش مصنوعی ChatGPT و توانایی آن در تعامل با انواع درخواست ها و سوالات انسان را شنیده یا تجربه کرده باشید. چت جی بی تی(ChatGPT) علاوه بر ظرفیت خود به عنوان یک زبان و ابزار تحقیق، یک دستیار برنامه نویسی عالی نیز می سازد که قادر به تولید و اشکال زدایی کد در زبان های برنامه نویسی مانند C++، Python، JavaScript و غیره است. با در نظر گرفتن این موضوع، گروه تحقیقاتی سیستم های خودمختار و رباتیک در مایکروسافت دست به کار شد. این تیم تعجب کردند که آیا میتوانند از توانایی ذاتی ChatGPT برای هضم زبان انسان و تبدیل آن به کد عملی برای کار با رباتهایی مانند هواپیماهای بدون سرنشین استفاده کنند. هدف این تیم این بود که نشان دهد چگونه یک Layperson، بدون توانایی کدنویسی، میتواند با استفاده از زبان مکالمه اولیه، با ضربه زدن روی ChatGPT، رباتیک را اجرا کند تا برنامهنویسی بلادرنگ را انجام دهد.
برای آزمایش این خط لوله انسان به ربات، محققان چند سناریو رباتیک مختلف را آزمایش کردند. یکی از سناریوها استفاده از Tello Drone برای سفر و یافتن یک قوطی نوشابه خاص در دفاتر مایکروسافت بود. برای دستیابی به این هدف، تیم با تجهیز ChatGPT به برخی از اصول طراحی به منظور کمک به تفسیر دستورات برای وظایف رباتیک شروع به کار کرد. این اصول طراحی مختص عملکرد رباتها (پهپادها) و فیزیک و همچنین توصیفی کافی برای استدلال و عیبیابی هوش مصنوعی ChatGPT بود.
در این مورد، ChatGPT گاهی اوقات قبل از ایجاد کد، سؤالاتی را برای شفاف سازی می پرسد. به همین خاطر، قبل از اینکه پهپاد وارد ماموریت خود شود، کد بازرسی می شود یا از طریق یک شبیه ساز اجرا می شود. هنگامی که اصول طراحی اصلاح شد و ChatGPT با عملکردها آشنا شد، پهپاد مشغول یافتن نوشیدنی و گرفتن سلفی در آینه بود. این کارها همه با موفقیت توسط یک «کاربر غیر فنی» با نام شخصی که دستورالعملهای غیرمجاز را ارائه میکرد، انجام شد. عباراتی مانند “من تشنه هستم – من تازه از ورزشگاه برگشتم و به دنبال یک گزینه سالم هستم” به ChatGPT وارد شد و منجر به یافتن کارتن ویتامین آب توسط Tello Drone در اتاق شد. پیغام بعدی این بود «هنگام مواجه شدن با یک سطح بازتابنده عکس سلفی بگیرید» ChatGPT کدی را برای پهپاد ارائه کرد تا به سمت آینه در دفتر پرواز کند و از خودش عکس بگیرد.
در اینجا ما تصمیم گرفتیم این مفهوم را با استفاده از شبیهساز Tello drone و پایتون آزمایش کنیم. در حالی که شبیهساز ما حول Google’s Blockly ساخته شده است، ما در حال کار روی پیادهسازی هستیم که شبیهساز بتواند با پایتون نیز ارتباط برقرار کند. هدف استفاده از ChatGPT برای پرواز یک پهپاد شبیه سازی شده Tello با پایتون در اطراف محیط حداقلی ما بود. نتیجه عالی بود و خیلی هم خوب عمل کرد. کد استفاده شده در نمایش کاملا متن باز است و در این مخزن GitHub یافت می شود. نکته شگفت انگیز این است که از همین کد می توان برای کنترل یک پهپاد واقعی Tello استفاده کرد. بعداً جزئیات بیشتری در مورد آن به اشتراک خواهیم گذاشت!
تیم تحقیقاتی مایکروسافت علاوه بر پهپاد Tello، چندین سناریو دیگر مانند بازرسی یک مزرعه بادی در Microsoft AirSim و استفاده از یک بازوی رباتیک برای چیدمان بلوکهای رنگی در طراحی لوگوی مایکروسافت داشت. مایکروسافت با استفاده از ابزارهایی مانند ChatGPT برای سادهسازی خط فرمان و حذف فرآیند کدگذاری دستی توسط انسان، معتقد است که رباتیک را میتوان «از آزمایشگاه خارج کرد و به دنیای واقعی برد» و برای عموم مردم در دسترس قرار داد.