OpenAI’nin GPT-4 API’sinin geçen ay beta test kullanıcılarına sunulmasından bu yana, gevşek bir geliştirici grubu, çok adımlı görevleri çok az insan müdahalesi ile gerçekleştirmeye çalışan yapay zeka modelinin aracı benzeri (“aracı”) uygulamaları üzerinde deneyler yapıyor. olabildiğince. Bu homebrew komut dosyaları, gerektiğinde bir yapay zeka modelinin yeni örneklerini döngüye alabilir, yineleyebilir ve döndürebilir.
Özellikle iki deneysel açık kaynak projesi sosyal medyada büyük ilgi gördü. heyecanlandırmak AI acımasızca projelendirir: tarafından oluşturulan Auto-GPT Toran Bruce Richardsve BabyAGI tarafından oluşturuldu Yohei Nakajima.
Onlar ne yapar? Şu anda, çok değil. Yol boyunca çok fazla insan girdisine ve el ele tutuşmaya ihtiyaçları var, bu yüzden henüz söz verildiği kadar özerk değiller. Ancak bunlar, potansiyel olarak tek başına çalışan tek bir yapay zeka modelinden daha yetenekli olabilecek daha karmaşık zincirleme yapay zeka modellerine yönelik ilk adımları temsil ediyor.
“Belirlediğiniz hedefe otonom olarak ulaşın”
Richards, senaryosunu “GPT-4 dil modelinin yeteneklerini sergileyen deneysel bir açık kaynak uygulaması” olarak tanımlıyor. Komut dosyası, “belirlediğiniz hedefe özerk bir şekilde ulaşmak için LLM ‘düşüncelerini’ bir araya getirir.”
Temel olarak, Auto-GPT, GPT-4’ten çıktı alır ve bir görevi daha fazla yineleyebilmesi, hataları düzeltebilmesi veya iyileştirmeler önerebilmesi için onu doğaçlama bir harici bellekle kendi içine geri besler. İdeal olarak, böyle bir komut dosyası, herhangi bir dijital görevi kendi başına gerçekleştirebilecek bir AI asistanı olarak hizmet edebilir.
Bu iddiaları test etmek için bir Windows makinesinde yerel olarak Auto-GPT (bir Python betiği) çalıştırdık. Başlattığınızda, AI aracınız için bir isim, rolünün bir açıklaması ve yerine getirmeye çalıştığı beş hedefin bir listesini ister. Kurarken, bir OpenAI API anahtarı ve bir Google arama API anahtarı sağlamanız gerekir. Auto-GPT çalışırken, oluşturduğu her adımı varsayılan olarak gerçekleştirmek için izin ister, ancak maceraperest hissediyorsanız tam otomatik bir mod da içerir.
“Eski bir çift Air Jordan satın al” gibi bir görevle görevlendirilirse, Auto-GPT çok adımlı bir plan geliştirir ve onu uygulamaya çalışır. Örneğin, ayakkabı satıcılarını arayabilir, ardından kriterlerinize uyan belirli bir çifti arayabilir. Ama o anda durur çünkü aslında şu anda hiçbir şey satın alamaz. Uygun bir satın alma API’sine bağlanırsa bu mümkün olabilir.
Auto-GPT’nin ne yaptığının tadına bakmak istiyorsanız, birisi benzer şekilde çalışan AgentGPT adlı web tabanlı bir sürüm oluşturmuştur.
Richards oldu çok açık Auto-GPT ile hedefi hakkında: bir tür AGI (yapay genel zeka) geliştirmek. Yapay zekada, “genel zeka” tipik olarak, bir yapay zeka sisteminin çok çeşitli görevleri yerine getirme ve özel olarak programlanmamış veya eğitilmemiş sorunları çözme konusundaki hala varsayımsal yeteneğini ifade eder.
Makul derecede zeki bir insan gibi, genel zekaya sahip bir sistem, yalnızca önceden tanımlanmış bir dizi kural veya modeli takip etmek yerine yeni durumlara uyum sağlayabilmeli ve deneyimlerden öğrenebilmelidir. Bu, belirli görevleri yerine getirmek veya sınırlı bir bağlam aralığında çalışmak üzere tasarlanmış dar veya özel zekaya (bazen “dar yapay zeka” olarak adlandırılır) sahip sistemlerin tersidir.
Bu arada, (adını yapay genel zekaya yönelik istek uyandıran bir hedeften alan) BabyAGI, Auto-GPT’ye benzer bir şekilde, ancak farklı bir görev odaklı lezzetle çalışır. Bunun bir sürümünü web’de “Tanrı Modu” başlıklı pek mütevazi olmayan bir sitede deneyebilirsiniz.
NakajimaBabyAGI’nin yaratıcısı , senaryosunu oluşturmak için Mart ayında GPT-4’ü otomatik olarak bir tür yapay zeka kurucu ortağı olarak işler kurmak için kullanmayı amaçlayan “HustleGPT” hareketine tanık olduktan sonra ilham aldığını söylüyor. Nakajima, “Tamamen yapay zekaya sahip bir kurucu oluşturup oluşturamayacağımı merak ettim” diyor.
Auto-GPT ve BabyAGI’nin AGI’nin gerisinde kalması, GPT-4’ün sınırlamalarından kaynaklanmaktadır. Bir dönüştürücü ve metin analizcisi olarak etkileyici olsa da GPT-4, Microsoft’un modelde AGI benzeri davranışların “kıvılcımlarını” gördüğüne dair bazı iddialara rağmen, yine de dar bir yorumlayıcı zeka yelpazesiyle sınırlı hissediyor. Aslında, şu anda Auto-GPT gibi araçların sınırlı kullanışlılığı, büyük dil modellerinin mevcut sınırlamalarının şimdiye kadarki en güçlü kanıtı olabilir. Yine de bu, bu sınırlamaların eninde sonunda aşılmayacağı anlamına gelmez.
Ayrıca, LLM’ler sadece bir şeyler uydurduğunda, konfabülasyonlar konusu, bu ajan benzeri asistanların kullanışlılığı için önemli bir sınırlama olduğunu kanıtlayabilir. Örneğin, bir Twitter ileti dizisinde birisi Auto-GPT’yi kullanarak bir rapor oluştur Web’de arama yaparak ve her şirketin ürünlerine ilişkin incelemelere bakarak su geçirmez ayakkabılar üreten şirketler hakkında. GPT-4, yolun herhangi bir adımında incelemeleri, ürünleri ve hatta analizini etkileyen tüm şirketleri potansiyel olarak “halüsinasyona uğratmış” olabilirdi.
Yararlı BabyAGI uygulaması sorulduğunda Nakajima, şu anda geliştirme aşamasında olan kendi kendini yürüten bir yapılacaklar listesi oluşturmayı hedefleyen Garrett Scott tarafından yapılan bir proje olan “Do Everything Machine” dışında somut örnekler bulamadı. Adil olmak gerekirse, BabyAGI projesi sadece yaklaşık bir haftalık. “Daha çok bir çerçeveye/yaklaşıma bir giriş niteliğinde ve en heyecan verici olan şey, insanların bu fikrin üzerine bina,” diyor.