Büyük bir dil modeli (LLM) AI eğitimi veren bir işletmeyseniz ve u/420NarutoConspiracy alt dizininden öğrenmesini istiyorsanız, yakında bunun için ödeme yapmanız gerekecek.
Sosyal haber ve tartışma toplayıcı Reddit’in kurucusu ve CEO’su Steve Huffman, geçtiğimiz günlerde The New York Times’a, çoğunlukla insanlar tarafından oluşturulan 18 yıllık içeriği geri çekmek amacıyla API’sine erişen şirketlerden ücret almayı planladığını söyledi. Yeni şartlarla ilgili ayrıntılar, Reddit’teki bir sonraki duyuru gönderisinde mevcuttur.
API, botlar ve diğer Reddit araçları üzerinde çalışan geliştiriciler ve akademik veya ticari olmayan projeler üzerinde çalışan araştırmacılar için yine de ücretsiz olacaktır. Ancak Reddit’in yapay zeka eğitimi amaçlı konuşmalarını basit bir şekilde sürdürmenin bir bedeli olacak ve bunun tam miktarları önümüzdeki haftalarda ulaşacak.
Huffman Times’a “Reddit veri külliyatı gerçekten değerli” dedi. “Ancak tüm bu değeri dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak vermemize gerek yok.
“Reddit’te gezinmek, değer üretmek ve bu değerin hiçbirini kullanıcılarımıza geri döndürmemek, sorun yaşadığımız bir konu. İşleri sıkılaştırmamız için iyi bir zaman.”
Reddit’in yorumları ve konuşmaları, LLM yapay zekalarını eğitmek için zengin bir kaynak olmuştur. ChatGPT ve Google’dan Bard, Reddit verilerini kaynaklarından biri olarak gösteriyor. Andy Baio ve Simon Willison, Stable Diffusion’ın görüntü oluşturma veri kümesinin (2,3 milyar) yalnızca bir alt kümesini (12 milyon) analizlerinde, “kullanıcı tarafından oluşturulan içerik platformlarının görüntü verileri için çok büyük bir kaynak olduğunu” belirtti. The Washington Post tarafından bugün yayınlanan birçok AI için ortak veri kaynaklarına ilişkin bir araştırma, “Reddit kullanıcıları tarafından yüksek puan alan bağlantılardan bir metin derlemesinin” GPT-3’e dahil edildiğini belirtti.
Reddit, AI’lara erişimi sınırlamayı amaçlasa da, geliştiricilere ve moderatörlere topluluklarında çalışmak için daha iyi araçlar sağlamayı planladığını söyledi. Reddit’in iOS ve Android uygulamaları, bir kullanıcının geçmişini hızlı bir şekilde görüntülemenin, topluluk kurallarını güncellemenin ve birden çok mod sırasını daha iyi yönetmenin yollarını sunacak.
The Information’a göre Reddit’in API erişimindeki değişimi, şirketin 2023’ün ikinci yarısında halka açılmayı planladığı sırada gerçekleşti. Reuters’e göre şirket, Aralık 2021’de gizli bir şekilde halka arz için başvuruda bulundu. Reuters’e göre 15 milyar dolarlık bir değerleme ummuştu, ancak özellikle teknoloji şirketleri etrafındaki piyasa koşulları iyileşene kadar başvurusunu erteledi.
Reddit kısmen, Ars Technica’nın ana şirketi Condé Nast’ın da sahibi olan Advance Publications’a aittir.