
Microsoft
Geçen hafta, Microsoft araştırmacıları, OpenAI tarafından oluşturulan popüler bir AI dil modeli olan ChatGPT’nin dil yeteneklerini kullanarak robotları ve dronları kontrol etmek için deneysel bir çerçeve duyurdu. ChatGPT, doğal dil komutlarını kullanarak robot hareketlerini kontrol eden özel kodlar yazabilir. Bir insan daha sonra sonuçları görüntüler ve görev başarıyla tamamlanana kadar gerektiği gibi ayarlar.
Araştırma” başlıklı bir makaleye ulaştı.Robotik için ChatGPT: Tasarım İlkeleri ve Model Yetenekleri”, Microsoft Otonom Sistemler ve Robotik Grubu’ndan Sai Vemprala, Rogerio Bonatti, Arthur Bucker ve Ashish Kapoor tarafından yazılmıştır.
Bir tanıtım videosunda Microsoft, görünüşe göre insan talimatlarını izlerken ChatGPT tarafından yazılan kod tarafından kontrol edilen robotları gösteriyor; blokları bir Microsoft logosuna yerleştirmek için bir robot kolu kullanıyor, bir rafın içeriğini incelemek için bir insansız hava aracı uçuruyor veya bir robot kullanarak nesneleri buluyor. görme yetenekleri ile.
Microsoft’un “ChatGPT for Robotics” tanıtım videosu.
Araştırmacılar, ChatGPT’nin robotik ile arayüz oluşturmasını sağlamak için ChatGPT’ye özel bir robotik API öğretti. “Topu al” gibi talimatlar verildiğinde, ChatGPT tıpkı bir şiir yazar veya bir makaleyi tamamlar gibi robotik kontrol kodu üretebilir. Bir insan, kodu doğruluk ve güvenlik açısından inceleyip düzenledikten sonra, insan operatör görevi yürütebilir ve performansını değerlendirebilir.
Bu şekilde, ChatGPT robotik kontrol programlamasını hızlandırır, ancak otonom bir sistem değildir. Makalede “ChatGPT’nin robotik için kullanımının tam otomatik bir süreç olmadığını vurguluyoruz”, “daha ziyade insan kapasitesini artırmaya yönelik bir araç görevi görüyor.”

Microsoft
ChatGPT’ye yapılan geri bildirimlerin çoğu (eylemlerinin başarısı veya başarısızlığı açısından) metin biçiminde insanlardan geliyor gibi görünse de, araştırmacılar ayrıca ChatGPT’nin kendisine görsel veri beslemede bazı başarılar elde ettiklerini iddia ediyorlar. Bir örnekte, araştırmacılar ChatGPT’ye bir robota kameradan gelen geri bildirimle bir basketbol topunu yakalamasını emretmekle görevlendirdiler: “ChatGPT, SVG kodunu kullanarak kamera görüntüsündeki topun ve gökyüzünün görünümünü tahmin edebilir. Bu davranış, LLM’nin metin tabanlı olasılıkların ötesine geçen örtük bir dünya modelinin izini sürüyor.”
Sonuçlar şimdilik ilkel görünse de, en yeni tech du jour’u (geniş dil modelleri) robotik kontrole uygulamaya yönelik ilk girişimleri temsil ediyor. Microsoft’a göre, bir ChatGPT arayüzü gelecekte robotları çok daha geniş bir kitleye açabilir.
Bir Microsoft Research blog gönderisinde “Bu araştırmadaki amacımız, ChatGPT’nin metnin ötesinde düşünüp düşünemeyeceğini ve robotik görevlerde yardımcı olmak için fiziksel dünya hakkında akıl yürütüp düşünemeyeceğini görmektir” diyor. “Karmaşık programlama dillerini veya robotik sistemlerle ilgili ayrıntıları öğrenmeye ihtiyaç duymadan insanların robotlarla daha kolay etkileşim kurmasına yardımcı olmak istiyoruz.”