
SOPA Resimleri / Getty Images
Eski bir çalışan tarafından çalındığı iddia edilen yaklaşık 45 GB’lık kaynak kod dosyası, Rus teknoloji devi Yandex’in birçok uygulama ve hizmetinin temelini ortaya çıkardı. Ayrıca, Yandex’in arama motoru için, neredeyse hiç kamuya açıklanmayan türden önemli sıralama faktörlerini de ortaya çıkardı.
“Yandex git kaynakları” 25 Ocak’ta bir torrent dosyası olarak yayınlandı ve görünüşe göre Temmuz 2022’de çekilmiş ve Şubat 2022’ye kadar uzanan dosyaları gösteriyor. Yazılım mühendisi Arseniy Shestakov, mevcut ve eski Yandex çalışanlarıyla bazı arşivlerin “kesinlikle” doğrulandığını iddia ediyor. şirket hizmetleri için modern kaynak kodu içerir.” Yandex, güvenlik blogu BleepingComputer’a “Yandex’in saldırıya uğramadığını” ve sızıntının eski bir çalışandan geldiğini söyledi. Yandex, “kullanıcı verilerine veya platform performansına yönelik herhangi bir tehdit görmediğini” belirtti.
Dosyalar, özellikle Rusya’nın Ukrayna’yı tam kapsamlı bir şekilde işgal etmeye başladığı Şubat 2022’ye ait. Yandex’in eski bir yöneticisi, BleepingComputer’a sızıntının “politik” olduğunu söyledi ve eski çalışanın kodu Yandex’in rakiplerine satmaya çalışmadığını kaydetti. Anti-spam kodu da sızdırılmadı.
Yandex’in kaynak kodunun ifşa edilmesinin güvenlik veya yapısal etkileri olup olmadığı net olmasa da, Yandex’in arama algoritmasındaki 1.922 sıralama faktörünün sızdırılması kesinlikle ses getiriyor. SEO danışmanı Martin MacDonald hack olayını Twitter’da anlattı “SEO’da yıllardır meydana gelen muhtemelen en ilginç şey” olarak (Arama Motoru Arazisi tarafından belirtildiği gibi). Daha dikkate değer faktörlerden bazılarını detaylandıran bir başlıkta, araştırmacı Alex Buraks’ın önerdiği “Google SEO için de pek çok yararlı bilgi var.”
Hacme göre dördüncü sıradaki arama motoru olan Yandex’in birkaç eski Google çalışanını çalıştırdığı iddia ediliyor. Yandex, Google’ın kodunda tanımlanabilen birçok sıralama faktörünü izler ve Google ile yoğun bir şekilde rekabet eder. Google’ın Rusya bölümü, yakın zamanda banka hesaplarını ve ödeme hizmetlerini kaybettikten sonra iflas başvurusunda bulundu. Buraks, Yandex’in sıralama faktörleri listesindeki ilk faktörün, görünüşe göre Google’ın kurucu ortakları tarafından oluşturulan temel algoritmaya bağlı olan “PAGE_RANK” olduğunu belirtiyor.
Buraks tarafından detaylandırıldığı üzere (içinde 2 İş Parçacığı), Yandex’in motoru şu sayfaları tercih eder:
- çok yaşlı değil
- Çok fazla organik trafiğe (tekil ziyaretçi) ve daha az arama odaklı trafiğe sahip olun
- URL’lerinde daha az sayı ve eğik çizgi var
- “PR=0” ile “sert kötümserleştirme” yerine optimize edilmiş koda sahip olun
- Güvenilir sunucularda barındırılmaktadır
- Wikipedia sayfaları olabilir veya Wikipedia’dan bağlantı verilebilir
- Bir etki alanındaki üst düzey sayfalardan barındırılır veya bağlanır
- URL’lerinde anahtar kelimeler bulunmalıdır (en fazla üç)
Rob Ousbey’in derlenmiş arama aracında tüm faktörleri arayabilir ve tıklayabilirsiniz. Sıralama faktörlerinin yaklaşık 1.000’inin “TG_DEPRECATED” etiketine sahip olduğunu ve 200’den fazlasının “TG_UNUSED” olarak listelendiğini fark edebilirsiniz. Kod Şubat 2022’ye ait olduğundan ve Temmuz 2022’de ele geçirildiğinden, Yandex’in araması o zamandan beri kesinlikle değişti. Ancak sızıntı, dünyanın en büyük ülkelerinden birine hizmet veren bir sitede arama sıralamalarının nasıl bir araya getirildiğine dair nadir bir bakış sunuyor.
Yandex daha önce arama motoru kodunun 2015 yılında, eski bir çalışanın kendi girişimini finanse etmek için karaborsada 28.000 dolara satmaya çalıştığında kapıdan çıktığını görmüştü. Yandex’in ana ürününün temel kodunun şaşırtıcı derecede düşük olması, gerçek değerinin farkında olmadığını gösteriyordu. Bu çalışan, ertelenmiş iki yıl hapis cezasına çarptırıldı ve kod hiçbir zaman kamuoyunda görülmedi.