Pazar, Haziran 23, 2024
Ana SayfaTeknoloji HaberleriMeta, metinden video oluşturan Make-A-Video'yu duyurdu

Meta, metinden video oluşturan Make-A-Video’yu duyurdu

Portre çizen bir oyuncak ayının AI tarafından oluşturulmuş bir videosundan hareketsiz görüntü.
büyüt / Portre çizen bir oyuncak ayının AI tarafından oluşturulmuş bir videosundan hareketsiz görüntü.

Bugün Meta, DALL-E ve Stable Diffusion gibi mevcut görüntü sentez araçlarına benzer şekilde metin veya görüntü istemlerinden yeni video içeriği oluşturabilen yapay zeka destekli bir video oluşturucu olan Make-A-Video’yu duyurdu. Henüz herkese açık olmasa da mevcut videoların varyasyonlarını da yapabilir.

Make-A-Video’nun duyuru sayfasında Meta, “şiddetli yağmurda yürüyen genç bir çift” ve “portre boyayan bir oyuncak ayı” gibi metinlerden oluşturulan örnek videoları gösteriyor. Ayrıca Make-A-Video’nun statik bir kaynak görüntü alma ve onu canlandırma yeteneğini de sergiliyor. Örneğin, bir deniz kaplumbağasının hareketsiz bir fotoğrafı, AI modelinde işlendikten sonra yüzüyormuş gibi görünebilir.

Make-A-Video’nun arkasındaki temel teknoloji ve neden bu tarihten daha erken geldiği bazı uzmanlar OpenAI’nin DALL-E’si gibi görüntü oluşturucularla kullanılan metinden görüntüye sentezleme ile mevcut çalışmayı oluşturması bekleniyor. Temmuz ayında Meta, Make-A-Scene adlı kendi metinden görüntüye AI modelini duyurdu.

Make-A-Video modelini etiketli video verileri (örneğin, gösterilen eylemlerin açıklamalı açıklamaları) üzerinde eğitmek yerine, Meta bunun yerine görüntü sentezi verilerini (alt yazılarla eğitilmiş durağan görüntüler) aldı ve modelin öğrenmesi için etiketlenmemiş video eğitim verilerini uyguladı. bir metin veya görüntü isteminin zaman ve mekanda nerede bulunabileceği duygusu. Ardından görüntüden sonra ne geleceğini tahmin edebilir ve sahneyi kısa bir süre için hareketli gösterebilir.

Meta bir beyaz kağıda, “İşlev koruyucu dönüşümleri kullanarak, model başlatma aşamasında uzamsal katmanları zamansal bilgileri içerecek şekilde genişletiyoruz.” “Genişletilmiş uzamsal-zamansal ağ, bir video koleksiyonundan zamansal dünya dinamiklerini öğrenen yeni dikkat modülleri içeriyor.”

Meta, Make-A-Video’nun nasıl veya ne zaman kamuya açık hale geleceği veya buna kimlerin erişebileceği hakkında bir açıklama yapmadı. Meta, gelecekte denemekle ilgilenen kişilerin doldurabilecekleri bir kayıt formu sağlar.

Meta, talep üzerine fotogerçekçi videolar oluşturma yeteneğinin belirli sosyal tehlikeler sunduğunu kabul ediyor. Duyuru sayfasının alt kısmında Meta, Make-A-Video’dan AI tarafından oluşturulan tüm video içeriğinin “izleyicilerin videonun AI ile oluşturulduğunu ve yakalanmış bir video olmadığını bilmelerini sağlamaya yardımcı olmak” için bir filigran içerdiğini söylüyor.

Tarih bir rehberse, rekabetçi açık kaynak metinden videoya modeller takip edebilir (bazıları, CogVideo gibi, zaten mevcuttur), bu da Meta’nın filigran korumasını alakasız hale getirebilir.

RELATED ARTICLES

Popüler Konular