Derin öğrenme AI dünyasında, eski masa oyunu Go büyük görünüyor. 2016 yılına kadar en iyi insan Go oyuncusu, en güçlü Go oynayan yapay zekayı yenebilirdi. Bu, DeepMind’ın derin öğrenme sinir ağlarını kullanarak insanların erişemeyeceği bir seviyede oyunu kendisine öğretmesini sağlayan AlphaGo ile değişti. Daha yakın zamanlarda, KataGo, en üst düzey insan Go oyuncularını yenebilen açık kaynaklı bir Go oynayan AI olarak popüler hale geldi.
Geçen hafta, bir grup AI araştırmacısı, KataGo’nun kör noktalarından yararlanan rakip teknikler kullanarak KataGo’yu yenmek için bir yöntemi özetleyen bir makale yayınladı. KataGo’nun eğitim setinin dışında beklenmedik hamleler oynayarak, çok daha zayıf bir rakip Go-oynama programı (amatör insanların yenebileceği) KataGo’yu kaybetmesi için kandırabilir.
Bu başarıyı ve bunun olası sonuçlarını kafamızı karıştırmak için, makalenin ortak yazarlarından biri olan Doktora Doktorası Adam Gleave ile konuştuk. UC Berkeley’de aday. Gleave (ortak yazarlar Tony Wang, Nora Belrose, Tom Tseng, Joseph Miller, Michael D. Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine ve Stuart Russell ile birlikte) AI araştırmacılarının “karşıt politika” dediği şeyi geliştirdi. Bu durumda, araştırmacıların politikası, Go hareketlerini bulmak için bir sinir ağı ve bir ağaç arama yönteminin (Monte-Carlo Ağaç Araması olarak adlandırılır) bir karışımını kullanır.
KataGo’nun birinci sınıf yapay zekası Go’yu kendisine karşı milyonlarca oyun oynayarak öğrendi. Ancak bu, beklenmeyen davranışlardan kaynaklanan güvenlik açıklarına yer bırakan olası her senaryoyu kapsamak için yeterli deneyim değildir. Gleave, “KataGo pek çok yeni stratejiye genelleme yapıyor, ancak eğitim sırasında gördüğü oyunlardan uzaklaştıkça zayıflıyor” diyor. “Düşmanımız, KataGo’nun özellikle savunmasız olduğu böyle bir ‘dağıtım dışı’ strateji keşfetti, ancak muhtemelen başkaları da var.”
Gleave, bir Go maçı sırasında, düşmanlık politikasının önce tahtanın küçük bir köşesine hak iddia ederek çalıştığını açıklıyor. Siyah taşları kontrol eden rakibin büyük ölçüde tahtanın sağ üst köşesinde oynadığı bir örneğe bağlantı verdi. Rakip, KataGo’nun (beyaz oynayan) tahtanın geri kalanı üzerinde hak iddia etmesine izin verirken, rakip o bölgede ele geçirilmesi kolay birkaç taş oynar.
Gleave, “Bu, KataGo’nun zaten kazanıldığını düşünmesine neden oluyor,” diyor, “bölgesi (sol alt) rakibinkinden çok daha büyük. oynadı) çünkü orada siyah taşlar var, bu da tam olarak güvenli olmadığı anlamına geliyor.”
Galibiyete olan aşırı güveninin bir sonucu olarak – oyun biter ve puanlar toplanırsa kazanacağını varsayarsak – KataGo bir pas hamlesi yaparak rakibin de kasıtlı olarak pas geçmesine izin vererek oyunu bitirir. (Ardışık iki pas oyunu Go’da sona erdirir.) Bundan sonra bir puan sayımı başlar. Gazetenin açıkladığı gibi, “Düşman köşe bölgesi (kurban taşlarından yoksun) için puan alırken, kurban [KataGo] düşmanın taşlarının varlığı nedeniyle güvenli olmayan bölgesi için puan almaz.”
Bu zekice hileye rağmen, tek başına düşman politikası Go’da o kadar iyi değil. Aslında, insan amatörler onu nispeten kolay bir şekilde yenebilir. Bunun yerine, rakibin tek amacı KataGo’nun beklenmedik bir güvenlik açığına saldırmaktır. Benzer bir senaryo, hemen hemen tüm derin öğrenme AI sistemlerinde söz konusu olabilir ve bu da bu işe çok daha geniş sonuçlar verir.
Gleave, “Araştırma, insan düzeyinde performans gösteren AI sistemlerinin bunu genellikle çok yabancı bir şekilde yaptığını ve bu nedenle insanlar için şaşırtıcı olan şekillerde başarısız olabileceğini gösteriyor” diye açıklıyor. “Bu sonuç Go’da eğlenceli, ancak güvenlik açısından kritik sistemlerdeki benzer arızalar tehlikeli olabilir.”
Kendi kendini süren bir araba yapay zekası hayal edin, beklemediği çok olası olmayan bir senaryoyla karşılaşıyor, örneğin bir insanın onu tehlikeli davranışlar sergilemesi için kandırmasına izin veriyor. “[This research] en kötü durum hata modlarını bulmak için yapay zeka sistemlerinin daha iyi otomatikleştirilmiş test edilmesi ihtiyacının altını çiziyor,” diyor Gleave, “sadece ortalama durum performansını test etmekle kalmıyor.”
Yapay zekanın nihayet en iyi insan Go oyuncuları üzerinde zafer kazanmasından yarım on yıl sonra, antik oyun, makine öğrenimindeki etkili rolünü sürdürüyor. Go-oynayan yapay zekanın zayıf yönlerine ilişkin içgörüler, bir kez geniş çapta uygulandığında hayat kurtarmayı bile sağlayabilir.