Perşembe günü Midjourney, yapay zeka destekli görüntü sentezi modelinin 5.2 sürümünü açıkladı.
OpenAI’nin DALL-E 2’si tarafından Ağustos 2022’de tanıtılan bir AI görüntü tekniği olan outpainting’e benzer şekilde Midjourney’nin uzaklaştırma özelliği, AI tarafından oluşturulmuş mevcut bir görüntüyü alabilir ve orijinal öznesini yeni görüntüde merkezde tutarken sınırlarını genişletebilir. Ancak DALL-E ve Photoshop’un Generative Fill özelliğinden farklı olarak, genişletmek için özel bir görüntü seçemezsiniz. Şu anda, v5.2’nin uzaklaştırma özelliği yalnızca abonelikli bir yapay zeka görüntü oluşturucu hizmeti olan Midjourney’de oluşturulan görüntülerde çalışıyor.
Midjourney Discord sunucusunda (hala Midjourney için resmi arayüz, bunu değiştirmek için planlar yapılıyor olsa da), kullanıcılar herhangi bir v5.2 görüntüsü (artık varsayılan) oluşturarak ve bir sonucu yükselterek uzaklaştırmayı deneyebilir. Bundan sonra, çıktının altında özel “Yakınlaştır” düğmeleri belirir. 1,5x, 2x faktörü veya 1 ile 2 arasında özel bir değer ile uzaklaştırabilirsiniz. “Kare Yap” adı verilen başka bir düğme, 1:1 kare en boy oranı oluşturacak şekilde mevcut görüntünün çevresinde malzeme oluşturur. .
Midjourney’in yaratıcısı David Holz, Perşembe gecesi Discord sunucusundaki yeni v5.2 özelliklerini ve geliştirmelerini duyurdu. “Uzaklaştır”ın yanı sıra, en önemli eklemeler arasında elden geçirilmiş bir estetik sistem, daha iyi görüntü kalitesi ve bir görüntünün ne kadar gerçekçi görünmediğini etkili bir şekilde etkileyen daha güçlü bir “–stilize” komutu yer alıyor. Ayrıca varsayılan olarak etkinleştirilen ve görüntü nesilleri arasındaki kompozisyon çeşitliliğini artıran yeni bir “yüksek varyasyon modu” vardır. Ek olarak, yeni bir “/shorten” komutu, kullanıcıların gerekli olmayan sözcükleri kesmek amacıyla bilgi istemlerini değerlendirmesine olanak tanır.
V5.2’nin hemen kullanıma sunulmasına rağmen Holz, duyurusunda değişikliklerin bildirimde bulunulmadan gerçekleşebileceğini vurguladı. Midjourney modelinin eski sürümleri, “/ settings” komutu veya “–v 5.1” satır içi komut bağımsız değişkeni kullanılarak hala kullanılabilir.
Julie Wieland gibi savunucular tarafından bazen “sentografi” olarak adlandırılan bu yeni görüntü sentezi sanat formunun hayranları için, v5.2’deki değişiklikler memnuniyetle karşılandı ve bazı Midjourney kullanıcıları onları “” olarak adlandırdı.çekici” Ve “akıl almaz“, şu anda AI’nın abartılı dünyasında alışılmadık üstünlükler değil. Ancak hayranlar, muhtemelen Midjourney’nin görsel iyileştirmelerinin şaşkınlığı haklı çıkardığını iddia edeceklerdir. reaksiyonlar kendi aralarında
En son güncelleme, modelin ayrıntı içermeyen nispeten kötü tanımlanmış görüntüler oluşturduğu Mart 2022’den bu yana bir dizi kalite iyileştirmesinin parçasıdır. Son olarak Midjourney, bu yılın Mart ayında v5.0’ı ve bu yılın Mayıs ayında v5.1’i piyasaya sürdü ve her ikisi de gerçekçiliği ve görüntü detayını iyileştirdi. v5 model serisi tanıtımı, Papa Francis ve Donald Trump’ın sosyal medyada derin sahtekarlıklarla ilgili endişelere yol açan gerçekçi görüntülerinin oluşturulmasına olanak sağladı.
Midjourney meraklıları arasında yeni özelliklerin yarattığı heyecana rağmen, bu yapay zeka sistemlerinin sanatçı danışmanlığı, kredisi veya izni olmadan web’den kazınmış milyonlarca görüntü kullanılarak nasıl eğitildiğinden dolayı görüntü sentezi bazı sanatçılar arasında oldukça tartışmalı olmaya devam ediyor. Midjourney, eğitim verilerinin tam içeriğini hiçbir zaman resmi olarak açıklamadı. Adobe, Firefly ile daha etik bir yol deniyor, ancak Venture Beat kısa süre önce aktif sanatçı izninin hala marjinal olduğunu bildirdi.
Şimdilik, Midjourney’nin göz açıcı teknik ilerlemelerini takdir etmemek ve bu teknoloji için ileriye dönük daha etik bir yol olup olmadığını merak etmemek zor – hem geleneksel hem de sentograf sanatçılarını memnun eden bir yol.