Cumartesi, Haziran 22, 2024
Ana SayfaTeknoloji HaberleriKoe Recast ile kıyafetleriniz kadar sesinizi de kolayca değiştirebilirsiniz.

Koe Recast ile kıyafetleriniz kadar sesinizi de kolayca değiştirebilirsiniz.

Aslında Koe ile ilgisi olmayan renkli bir dalga formu: Recast.
büyüt / Renkli bir dalga formu, kawaii arayan gizli uzayda dramatik bir şekilde dönüyor.

Koe Recast adlı yeni bir AI aracının web demosu sayesinde, sesinizi bir anime karakteri, derin bir erkek anlatıcı, bir ASMR fısıltısı ve daha fazlası dahil olmak üzere 20 saniyeye kadar farklı tarzlara dönüştürebilirsiniz. Şu anda özel alfa testinden geçmekte olan potansiyel bir ticari ürünün ufuk açıcı bir önizlemesidir.

Koe Recast, yakın zamanda Texas merkezli bir geliştiriciden ortaya çıktı. Yakın, insanların seslerini Zoom ve Discord gibi diğer uygulamalar aracılığıyla gerçek zamanlı olarak değiştirmelerine izin vermek amacıyla bir masaüstü uygulaması geliştirmek için bağımsız olarak çalışıyor. Near, Ars ile yaptığı kısa bir röportajda, “Amacım, insanların kendilerini daha mutlu edecek şekilde ifade etmelerine yardımcı olmak” dedi.

Koe web sitesindeki birkaç demo, tümü Recast tarafından desteklenen, bir kadın sesi, derin bir erkek anlatıcı sesi ve yüksek perdeli bir anime sesiyle artırılmış gerçeklikten bahseden Mark Zuckerberg’in değiştirilmiş kliplerini gösteriyor.

Bu tür gerçekçi AI destekli ses dönüştürme teknolojisi yeni değil. Google, 2018’de benzer teknolojiyle dalgalar yarattı ve ünlülerin sesli derin sahtekarlıkları birkaç yıldır tartışmalara neden oldu. Ancak bu yeteneği bir kişi tarafından finanse edilen bağımsız bir girişimde görmek – “Bu projeyi şimdiye kadar tamamen kendim finanse ettim,” dedi Near – AI vokal sentez teknolojisinin ne kadar ilerlediğini gösteriyor ve belki de ses dönüşümünün ne kadar yakın olabileceğinin ipuçlarını veriyor. düşük maliyetli veya açık kaynaklı bir sürüm aracılığıyla yaygın olarak benimsenmesi.

Ne tür bir yapay zekanın, Recast’in kaputun altındaki ses dönüşümüne güç verdiği sorulduğunda, Near ayrıntıları tuttu, ancak nasıl çalıştığını genelleştirdi, “Oluşturduğumuz yerleştirme alanı içindeki seslerin özelliklerini inceleyebilir ve değiştirebiliriz. o halde amaç, prozodi ve kelimeler gibi konuşulan içeriğe karşılık gelen ses kısımlarını korurken, bir konuşmacının kişisel stiline veya tınısına karşılık gelen ses kısımlarını değiştirmektir. algılanan cinsiyet, yaş, etnik köken vb. dahil olmak üzere başka herhangi bir stil.”

Recast, 10 farklı sesi destekliyor ve daha fazlası yolda. Near, “Şu anda ünlülerin veya diğer tanınmış kişilerin mevcut seslerini sunup sunmayacağımıza karar verilmedi” dedi.

Ancak ünlü sesleri (veya ünlü olmayan canlı kişileri taklit edenler) sunmak etik ve yasal sorular doğurabilir. Recast’in olası kötüye kullanımı sorulduğunda, Near, “Her teknolojide olduğu gibi, hem olumlu hem de olumsuz olması mümkündür, ancak insanlığın büyük çoğunluğunun harika insanlardan oluştuğunu ve bundan büyük fayda sağlayacağını düşünüyorum.” Yakın ayrıca, Recast’in yasa dışı ve nefret dolu kullanımı yasaklayan bir Hizmet Şartları politikası içerdiğine dikkat çekti.

Bir yayın zaman çizelgesine gelince, Near ticari seçenekleri takip ediyor, ancak gerçekçi ses derin sahtekarlıklarını katı kısıtlamalar olmaksızın birçok kişinin eline vererek Stable Difusion’a benzer bir etkiye sahip olabilecek bir açık kaynak sürümünü dışlamıyor. Near, “Bazı para kazanma stratejilerini araştırıyoruz” dedi. “Aklımdaki kâr modelleri işe yaramazsa, bu teknolojiyi açık kaynak kullanmak gelecekte bir seçenek olabilir.”

Derin öğrenme teknolojisi, gerçekliğin sabit ve doğru bir kaydı olarak medyanın 20. yüzyıl kavramını (veya bazıları “illüzyon” diyebilir) soymaya devam ederken, yaşayan bir insan sesinin dijital temsillerinin, Görüntüler ve videolar gibi, kaynağa önemli bir güven duymadan gerçek değeriyle alamayacağınız bir şey daha olacaktır. Yine de teknoloji, aksi takdirde çevrimiçi iş yaparken veya sadece eğlenirken ayrımcılığa uğrayabilecek birçok insanı güçlendirebilir.

RELATED ARTICLES

Popüler Konular