Perşembe, Haziran 20, 2024
Ana SayfaTeknoloji HaberleriSahte Joe Rogan, yapay zeka destekli bir podcast'te sahte Steve Jobs ile...

Sahte Joe Rogan, yapay zeka destekli bir podcast’te sahte Steve Jobs ile röportaj yapıyor

Üç Steve Jobs yüzünün yapay zeka tarafından oluşturulmuş çizimi.
büyüt / Hangi Steve Jobs gerçek?

Ars Teknik

Dubai merkezli bir ses sentezi şirketi, Joe Rogan ve Steve Jobs arasında, her iki adamdan dijital olarak klonlanmış gerçekçi sesleri kullanarak kurgusal bir podcast röportajı yayınladı. Ses sentezi hizmetleri satan Play.ht tarafından oluşturulan “Podcast.ai” adlı sözde bir podcast dizisinin “ilk bölümü” sırasında gerçekleşir.

Röportajda, önce Ars’ta daha önce ele aldığımıza benzer ses klonlama teknolojisiyle oluşturulan Rogan’ın sesinin bir kopyasını duyuyorsunuz. Derin öğrenme teknolojisi, Disney’deki Darth Vader örneğinde olduğu gibi, AI modellerinin ayırt edici sesleri yüksek derecede doğrulukla çoğaltmasına izin verdi. Obi-Wan Kenobi Televizyon dizisi.

Efekti elde etmek için, birinin önce AI modelini klonlanacak sesin mevcut örnekleri üzerinde eğitmesi gerekir. Rogan, podcast’lerinde izole edilmiş sesinin bol miktarda bulunduğundan, derin öğrenme modelleriyle AI ses eğitimi için birincil hedeftir. Aslında The Verge, 2019’da Dessa sentezleyen Rogan adlı bir AI şirketi tarafından bir PR dublörlüğü yaptı.

Bu yapay zeka sahtekarlığı örneğinin daha ilginç hale geldiği yer, Play.ht’in ayrıca ölen Apple CEO’su Steve Jobs’un sesini de duyması. Sesi, zaman zaman robot gibi dalgalı olsa da, 2000’lerin sonlarındaki Apple açılış notlarını ve All Things Digital röportajlarını hatırlatıyor. Play.ht, röportaj metninin de muhtemelen GPT-3’e benzer büyük bir dil modelinden (LLM) AI tarafından oluşturulduğunu iddia ediyor.

Play.ht, Podcast.ai web sitesinde “Transkriptler ince ayarlı dil modelleriyle oluşturulur” diye yazıyor. “Örneğin, Steve Jobs bölümü biyografisi ve çevrimiçi bulabileceğimiz tüm kayıtları üzerine eğitildi, böylece AI onu doğru bir şekilde hayata döndürebilir.”

LLM köklerine uygun olarak, 19 dakikalık görüşme pek mantıklı değil. Bir süre sonra, kurgusal röportajın bölümleri, estetik, devrim niteliğindeki ürünler, Google, Microsoft ve Adobe gibi rakipler ve orijinal Macintosh’un zaferleri dahil olmak üzere Jobs’un ortak konuşma noktalarının kavramsal karışımı gibi görünmeye başlar.

Örneğin, röportajın bir bölümünde sahte Jobs, gerçek Jobs’ın 1995 yılında ünlü bir röportajda söylediklerine çok benzeyen Microsoft eleştirisini araştırıyor. İneklerin Zaferi, ama bu bir karbon kopyası değil ve ikisini karşılaştırırsanız sesin sentezlendiğini anlayabilirsiniz. Sahte Jobs, “Microsoft’ta her zaman yaşadığım sorun bu” diyor. “Birçok yönden zeki insanlar ve iyi iş çıkardılar, ama hiçbir zaman zevkleri olmadı. Hiçbir zaman estetik duyguları olmadı.”

Jobs’un veya Rogan’ın vokal benzerliklerini bu şekilde kullanmanın yasal olup olmadığı – özellikle ticari bir ürünü tanıtmak için – görülecektir. Podcast’in PR dublör doğasına rağmen, tamamen kurgusal ünlü podcast’leri kavramı dikkatimizi çekti. Ses sentezi daha yaygın ve potansiyel olarak tespit edilemez hale geldikçe, herhangi bir çağa ait medya ürünlerinin büyük olasılıkla tamamen akıcı ve dövülebilir, herhangi bir anlatıya uyacak şekilde şekillendirilebilir olacağı bir geleceğe bakıyoruz. Bu özel kurgusal dünyada, Jobs büyük bir Rogan hayranıdır.

“Arabada arkanıza yaslanıp nutuklarınızı dinlemek güzel,” diyor.

RELATED ARTICLES

Popüler Konular