Salı günü Meta AI, stratejik masa oyununda insan düzeyinde performans elde eden ilk AI olduğunu iddia ettiği Cicero’nun geliştirildiğini duyurdu. diplomasi. Bu dikkate değer bir başarıdır çünkü oyun derin kişilerarası müzakere becerileri gerektirir, bu da Cicero’nun oyunu kazanmak için gerekli olan dil konusunda belirli bir ustalık kazandığı anlamına gelir.
Deep Blue, 1997’de satrançta Garry Kasparov’u yenmeden önce bile, masa oyunları yapay zeka başarısının yararlı bir ölçüsüydü. 2015’te AlphaGo, Go ustası Lee Sedol’u yendiğinde başka bir engel daha düştü. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisi izler (ancak Go’nun kuralları genellikle bilgisayar yapay zekası için basitleştirilmiştir).
Fakat diplomasi, oyunun büyük bir kısmı sosyal becerileri içerir. Oyuncular kazanmak için empati göstermeli, doğal bir dil kullanmalı ve ilişkiler kurmalıdır ki bu bir bilgisayar oyuncusu için zor bir görevdir. Bunu akılda tutarak Meta, “İnsanların yaptığına benzer stratejik hedeflere ulaşmak için insanlarla müzakere etmek, ikna etmek ve onlarla birlikte çalışmak için dili kullanabilen daha etkili ve esnek aracılar oluşturabilir miyiz?” diye sordu.
Meta’ya göre cevap evet. Cicero, becerilerini çevrimiçi bir sürümünü oynayarak öğrendi. diplomasi webDiplomacy.net’te. Zamanla, oyunda bir usta haline geldi, bildirildiğine göre insan oyuncuların “ortalama puanının iki katından fazlasını” elde etti ve birden fazla oyun oynayan kişilerin ilk yüzde 10’u arasında yer aldı.
Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal dil işleme (GPT-3’e benzer) için yapay zeka modellerini bir araya getirdi ve bunları tek bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumuna ve konuşma geçmişine bakar ve diğer oyuncuların nasıl davranacağını tahmin eder. İnsan benzeri diyaloglar oluşturabilen ve diğer oyuncularla koordineli çalışmasına izin veren bir dil modeli aracılığıyla yürüttüğü bir plan hazırlar.
Meta, Cicero’nun doğal dil becerilerini, Cicero’nun kişiliğinin kalbinin yattığı “kontrol edilebilir bir diyalog modeli” olarak adlandırır. GPT-3 gibi, Cicero da web’den kazınmış büyük bir İnternet metni külliyatından alır. Meta, “Kontrol edilebilir bir diyalog modeli oluşturmak için internetten gelen metin üzerinde önceden eğitilmiş ve webDiplomacy.net’te 40.000’den fazla insan oyununda ince ayar yapılmış 2,7 milyar parametreli BART benzeri bir dil modeliyle başladık” diye yazıyor Meta.
Ortaya çıkan model, karmaşık bir oyunun inceliklerinde ustalaştı. Meta, “Örneğin, Cicero, oyunun ilerleyen bölümlerinde belirli bir oyuncunun desteğine ihtiyaç duyacağını anlayabilir ve ardından o kişinin gözüne girmek için bir strateji oluşturabilir ve hatta o oyuncunun gördüğü riskleri ve fırsatları fark edebilir” diyor. onların özel bakış açısından.”
Meta’nın Cicero araştırması, Science dergisinde “Dil modellerini stratejik akıl yürütmeyle birleştirerek Diplomasi oyununda insan düzeyinde oyun” başlığıyla yayınlandı.
Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının, birisine yeni bir beceri öğretmek için uzun vadeli bir konuşma sürdürmek gibi, insanlar ve yapay zeka arasındaki “iletişim engellerini hafifletebileceğini” öne sürüyor. Veya NPC’lerin tıpkı insanlar gibi konuşabildiği, oyuncunun motivasyonlarını anladığı ve yol boyunca uyum sağladığı bir video oyununu güçlendirebilir.
Aynı zamanda, bu teknoloji, insanları taklit ederek ve bağlama bağlı olarak potansiyel olarak tehlikeli şekillerde kandırarak insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, diğer araştırmacıların kendi kodunu “sorumlu bir şekilde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor; bu muhtemelen Cicero’nun İnternet metinlerinden öğrendiği diyaloğa atıfta bulunuyor. büyük dil modelleri için her zaman bir risktir.
Meta, Cicero’nun nasıl çalıştığını açıklamak için ayrıntılı bir site sağladı ve ayrıca Cicero’nun kodunu GitHub’da açık kaynaklı hale getirdi. Çevrimiçi diplomasi hayranların – ve hatta belki de geri kalanımızın – dikkat etmesi gerekebilir.