Çarşamba, Temmuz 24, 2024
Ana SayfaTeknoloji HaberleriHerkes için 3D? Nvidia'nın Magic3D'si metinden 3D modeller üretebilir

Herkes için 3D? Nvidia’nın Magic3D’si metinden 3D modeller üretebilir

Magic3D tarafından 3B model olarak oluşturulmuş bir zehirli ok kurbağası.
Büyüt / Magic3D tarafından 3B model olarak oluşturulmuş bir zehirli ok kurbağası.

Nvidia

Cuma günü, Nvidia araştırmacıları, metin açıklamalarından 3B modeller oluşturabilen bir yapay zeka modeli olan Magic3D’yi duyurdu. Magic3D, “Nilüfer üzerinde oturan mavi zehirli ok kurbağası” gibi bir bilgi istemi girdikten sonra, yaklaşık 40 dakika içinde renkli dokuyla tamamlanmış bir 3B ağ modeli oluşturur. Değişikliklerle, ortaya çıkan model video oyunlarında veya CGI sanat sahnelerinde kullanılabilir.

Nvidia, akademik makalesinde Magic3D’yi, Google araştırmacılarının Eylül ayında duyurduğu bir metinden 3B’ye dönüştürme modeli olan DreamFusion’a bir yanıt olarak çerçeveliyor. DreamFusion’un daha sonra hacimsel NeRF (Sinirsel parlaklık alanı) verilerine göre optimize edilen bir 2D görüntü oluşturmak için metinden görüntüye bir model kullanmasına benzer şekilde, Magic3D de düşük çözünürlükte oluşturulmuş kaba bir modeli alıp optimize eden iki aşamalı bir işlem kullanır. daha yüksek çözünürlüğe. Makalenin yazarlarına göre, ortaya çıkan Magic3D yöntemi, DreamFusion’dan iki kat daha hızlı 3B nesneler üretebilir.

Magic3D, 3B kafeslerin komut istemine dayalı düzenlemesini de gerçekleştirebilir. Düşük çözünürlüklü bir 3B model ve bir temel komut verildiğinde, ortaya çıkan modeli değiştirmek için metni değiştirmek mümkündür. Ayrıca, Magic3D’nin yazarları, aynı konunun birkaç nesil boyunca korunduğunu (genellikle tutarlılık olarak adlandırılan bir kavram) ve bir 2B görüntünün stilini (kübist bir resim gibi) bir 3B modele uyguladığını gösterir.

Nvidia, akademik makalesiyle birlikte herhangi bir Magic3D kodu yayınlamadı.

Metinden 3B oluşturma yeteneği, bir veri gövdesi üzerinde yoğun eğitimden sonra yeni içeriği sentezlemek için sinir ağlarını kullanan günümüzün difüzyon modellerinde doğal bir evrim gibi geliyor. Yalnızca 2022’de, DALL-E ve Stable Diffusion gibi yetenekli metinden resme modellerin ve Google ve Meta’dan temel metinden videoya oluşturucuların ortaya çıktığını gördük. Google ayrıca iki ay önce yukarıda bahsedilen metinden 3B’ye model DreamFusion’ı piyasaya sürdü ve o zamandan beri insanlar benzer teknikleri Stable Diffusion’a dayalı bir açık kaynak modeli olarak çalışmak üzere uyarladılar.

Magic3D’ye gelince, arkasındaki araştırmacılar, herkesin özel bir eğitime ihtiyaç duymadan 3D modeller oluşturmasına izin vereceğini umuyor. Ortaya çıkan teknoloji bir kez rafine edildikten sonra video oyunu (ve VR) geliştirmeyi hızlandırabilir ve belki de sonunda film ve TV için özel efektlerde uygulamalar bulabilir. Makalelerinin sonuna doğru, “Magic3D ile 3D sentezi demokratikleştirebileceğimizi ve 3D içerik oluşturmada herkesin yaratıcılığını açabileceğimizi umuyoruz.”

RELATED ARTICLES

Popüler Konular