Cumartesi günü, AI görüntü hizmeti Midjourney, Discord sunucusundaki aboneler için mevcut olan metinden görüntüye sentez modelinin 4. sürümünü (“v4”) alfa testine başladı. Yeni model, hizmette daha önce mevcut olandan daha fazla ayrıntı sağlar ve bazı AI sanatçılarına, v4’ün basit istemlerden yüksek kaliteli sonuçlar almayı neredeyse “çok kolay” hale getirdiğini söylemelerine ilham verir.
Midjourney, AI görüntü sentezi modellerinin erken dalgasının bir parçası olarak Mart ayında halka açıldı. Farklı stili ve DALL-E ve Stable Difusion’dan önce halka açık olması nedeniyle hızla büyük bir takipçi kitlesi kazandı. Çok geçmeden, Midjourney yapımı sanat eserleri, sanat yarışmalarını kazanarak, potansiyel olarak tarihi telif hakkı kayıtları için materyal sağlayarak ve stok illüstrasyon web sitelerinde görünerek (daha sonra yasaklandı) haberi yaptı.
Midjourney zamanla modelini daha fazla eğitim, yeni özellikler ve daha fazla ayrıntıyla geliştirdi. “v3” olarak bilinen mevcut varsayılan model, Ağustos ayında piyasaya sürüldü. Şimdi, Midjourney v4, hizmetin Discord sunucusunun Midjourney botu aracılığıyla görüntüler oluşturan binlerce üyesi tarafından test ediliyor. Kullanıcılar şu anda istemlerine “–v 4” ekleyerek v4’ü deneyebilir.
Midjourney kurucusu David Holz bir Discord duyurusunda “V4 tamamen yeni bir kod tabanı ve tamamen yeni bir AI mimarisidir” dedi. “Bu, yeni bir Midjourney AI üstkümesi üzerinde eğitilmiş ilk modelimiz ve 9 ayı aşkın süredir yapım aşamasında.”
Midjourney’in v4 modeli üzerinde yaptığımız testlerde, v3’ten çok daha fazla ayrıntı sağladığını, komutların daha iyi anlaşılmasını, daha iyi sahne kompozisyonları ve bazen konularında daha iyi orantılılık sağladığını gördük. Fotogerçekçi görüntüler ararken, gördüğümüz bazı sonuçları daha düşük çözünürlüklerdeki gerçek fotoğraflardan ayırt etmek zor olabilir.
Holz’a göre v4’ün diğer özellikleri arasında şunlar yer alıyor:
– Çok daha fazla bilgi (yaratıklar, yerler ve daha fazlası hakkında)
– Küçük ayrıntıları doğru bir şekilde elde etmede çok daha iyi (her durumda)
– Daha karmaşık istemleri ele alır (birden çok ayrıntı düzeyiyle)
– Çok nesneli / çok karakterli sahnelerde daha iyi
– Görüntü istemi ve çoklu istemler gibi gelişmiş işlevleri destekler
– Çeşitli görüntü ızgaralarını kontrol etmek için –chaos argümanını (0’dan 100’e ayarlayın) destekler
Midjourney v4’e tepki, hizmetin Discord’unda olumlu oldu ve iyi sonuçlar elde etmek için düzenli olarak karmaşık istemlerle boğuşan diğer görüntü sentezi modellerinin hayranları not alıyor.
Jon Bristow adlı bir Redditor, r/StableDiffusion topluluğunda, “Midjourney v4’ün ‘çok kolay’ olduğunu düşünen başka biri var mı? önceden hazırlanmıştı.” Cevap olarak, biri şaka yaptı, “Bir ay önce yarattıkları yeni işlerini kaybedecek olan profesyonel bilgilendiriciler için üzücü.”
Midjourney, v4’ün hala alfa aşamasında olduğunu ve bu nedenle yeni modelin tuhaflıklarını zaman içinde düzeltmeye devam edeceğini söylüyor. Şirket, v4’ün yükseltilmiş görüntülerinin çözünürlüğünü ve kalitesini artırmayı, özel en boy oranları (v3 gibi) ekleyerek, görüntü netliğini artırmayı ve metin bozulmalarını azaltmayı planlıyor. Midjourney, ayda 10 ABD Doları ile 50 ABD Doları arasında değişen aylık bir abonelik ücreti karşılığında kullanılabilir.
Midjourney’in sekiz aydan fazla bir süredir kaydettiği ilerlemeyi göz önünde bulundurarak, görüntü sentezinde gelecek yılki ilerlemenin ne getireceğini merak ediyoruz.
Tartışmaya git…