İyinet'e Hoşgeldiniz!

Türkiye'nin En Eski Webmaster Forum'una Hemen Kayıt Olun!

Kayıt Ol!

Google Matematiği

Gur.Kem

0
İyinet Üyesi
Katılım
21 Temmuz 2008
Mesajlar
454
Reaction score
1
İşte Google'nin Formülü




Web sitelerinin kaderini KÜÇÜK BİR ALGORITMA elinde tutuyor : İşte Google'nin alt sayfa sıralaması (pagerank) formülü.



Söze birkaç gerçekle başlayalım: İnternet muazzam büyüklükte ve web siteleri, okyanusta bidamladan farksız . Web sitelerinin sayısı birle ikiyle değil, bol sıfırlı rakamlarla ölçülüyor . Böyle bir durumda , tek bir sitenin diğerlerinin arasından sıyrılması , kendini kullanıcıya göstermesi çok kolay değil . Kullanıcı , adresini bilmediği bir web sitesine genelde Google'de arama yaparken , sonuçlar arasından rastlarsa giriyor . İnternetin ve Google'in kuralları hem çok katı hem de Darwin'in kuramını çağrıştırıyor .
Peki, birbirine benzer yüzlerce site gisinin yukarıda hangisinin aşağıda olduğu nasıl belirleniyor ? Bu sorunun yanıtı , Google'in kurucuları Larry Page ve Sergey Brin tarafından "Pagerank" formülü adıyla yanıtnıyor . Bu formülü bilen , anlayan ve kullanan , internete hükmediyor . Doğru dürüst kullyan ise cezasını çekiyor .Peki pagerank nasıl işliyor vbir web sitesi hangi durumda arama lisetelerinin zirvesine yerleşiyor ?



Pagerank: İşte formülün iç yüzü


Pagerank steminin altında çok basit ve dürüst bir yaklaşım yatıyor .
1.Her web sitesi için , o siteye bağlantı veren bir grup başka web sitesi vardır .
2. Bu web sitelerinin de her birinin kendi pagerank değeri vardır .
3. B sayfasından A sayfasına verilen bağlantı , B sayfasının A sayfasına destek oyu sayılır .
4. Ek olarak , A sayfasına oy veren B sayfasının pagerankı da değerlendirmeye katılır . B'nin sıralama değeri ne kadar yüksekse o kadar iyidir.
5. B sayfasında kaç adet bağlantı verildiği de önemlidir . B'deki toplam bağlantıların sayısı ne kadar azsa , bu A'nın pagerank değerine o kadar olumlu katkı yapar .
6. Tüm pagerankların toplamı , webdeki dökümanların toplam sayısına eşittir . Pagerank , bir belgenin tüm internetteki ağırlığı ile ilgilidir .
Unutmayınki pagerank değeri web siteleri için değil , her bir web sayfası için hazırlanıyor . Yani bir web sunucusunda yer alan bir makalenin pagerank değeri , ana sayfanın değerinden yüksek olabilir.

Bunu bir formüle dönüştürdüğümüzde , pagerank şu şekilde görünüyor :

PR(A) = (1-d) + d(PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))


Bu da şu şekilde okunabilir : A sayfasının sayfa sıralaması , T1'den Tn'e kadar giden sayfaların sayfa sıralaması değerinin , bu sayfalardaki bağlantı sayısına bölünmesiyle elde edilir.Buna , daha sonraki işlemlerde büyük rol oynayan handikap faktörü ekleniyor .

Pagerank ilkesini biz daha anlaşılır yapmak için , tüm WWW'nin sadece dört sayfadan oluştuğunu farz edelim .Bunlar da , A,B,C,D isimli web siteleri olsun . Hepsinin başlangıçtaki pagerank değeri 1 olsun .

Sayfa sıralaması değerlerinin toplamı , internette yer alan toplam sayfa sayısını , yani 4'ü verecektir .İlk örneğimiz için , B,C,D'den A'ya birer link verilmiş olsun . Bundan başka hiçbir bağlantı bulunmasın .Handikap faktörünü şimdilik hesaba katmıyoruz.

Böylelikle A'nın pagerank değeri 3 ediyor .


Biraz daha karmaşık anlatacak olursak ,

A sayfası B'ye ve C'ye bağlantı veriyor . C ise , A,B, ve D'ye . D'nin tek bağlantısı ise B sayfasına .
Bu durumda A'nın formülü şöyle olacaktır :

PR(A) = 1/1 + 1/3 .

Çünkü B'den gelen bağlantı 1 sayılmıştır . C'de ise üç bağlantı bulunduğundan , ordan gelen bağlantı 0,33 değerindedir .Böylelikle toplam değer 1,33 olur .
B'nin formülü : PR (B) = 1/2 + 1/3 + 1/1 . Yani yaklaşık 1.83 .
C'nin formülü : PR (C) = 1/2 . Yani 0,5'tir .
D'nin formülü : PR (D) = 1/3 . Yani yaklaşık 0,33'tür .

Toplamda yine tüm sayfaların sayısını elde etmemiz gerekiyor : 3,99.

Kayıp olan 0,01 yuvarlamanın sonucu . Ancak bu hesaplamada birşeydaha eksik : O da her bir websitesinin pagerank değerinin formülde her almayışı . Bir kez daha örneğine bakalım . Bu formülde , sayfa sıralamalarını 1 almak yerine , önceki basamakta elde ettiğimiz değerleri kullanırsak ;

PR (B) := 1/2 + 1/3 + 1/1

Yerine

PR (B) = 1,33/2 + 0,5/3 + 0,33/1

Formülünü elde ederiz ve sonuç yaklaşık 1,62 eder. Doğal olarak B'nin sayfa sıralamasının yeniden hesaplanması A,C ve D'nin değerini değiştirecektir . D'nin değeri tekrar hesaplanınca B'nin değeri de yeniden hesaplanmak zorunda kalacaktır .
Bu yüzden , Google pagerank değerlerini tekrar tekrar toplayarak yaklaşık değerleri buluyor .Arama motoru , bir hesaplama döngüsünün sonucunu bir sonraki adımda kullanıyor . Page ile Brin'in açıklamasına göre kaydedilmiş milyarlarca sayfanın pagerankını hesaplamak için döngünün yaklaşık 100 kez tekrarlanması gerekiyor .



Handikap Faktörü : Kullanıcıyı da hesaba katınca


Google'in varsımına göre pagerank , webde dolaşan birinin sırf bağlantıları tıklayarak belirli bir siteye ulaşma olasılığını temsil ediyor . Ama bu kişinin sonsuza dek bağlantı tıklamayacağını düşünürsek , formüle bir faktörün eklenmesi gerekiyor . Bu , sörfçünün bağlantıları izlemekten bıkması olasılığını simule ediyor . Handikap , sayfadaki her bir bağlantı bşaına toplam oy sayısıyla hesaplanıyor . Sergey Brin ile Larry Page bu faktörü 0,85 olarak alıyorlar Bu faktörün Google gerçekliğinde de aşağı yukarı bu civarda olduğu düşünülebilir .
Gerçek pagerank ise yukarıdaki örnektenin tersine , 0 ile 1 arasında bir olasılık değeri olarak belirleniyor . Küçük yüzdelik değerler ise web sayfasının pagerank'inda söz sahibi oluyor . Örneğin 0,01 değerine sahip bir sitede , bağlantıları kazayla ya da rasgele tıklayan bir kullanıcının bu siteye düşme ihtimali % 1 .
Bununla birlikte geriye çözülmemiş bir gizem kalıyor . Eğer pagerank 0 ile 1 arasında bir değer olarak hesaplanıyorsa Google araç çubuğundaki pagerank değeri neden 1 ile 10 arasında değişiyor ? Yanıt : Çünkü Google bu değerleri dönüştürüyor . Bu dönüştürme işleminin ne şekilde gerçekleştiği tam olarak bilinmese de , birçok uzman işlemin lineer değil logaritmik olduğu görüşünde . Bir başka deyişle , araç çubuğunda pagerank değerinin 1'den 2'ye geçişi , 9'dan 10'a geçişinden daha kolay .



Filtre : Pagerank kar etmeyince


Pagerank formülü sayesinde Google interneti büyük bir başarıyla elden geçiriyor. Yine de bu başarının açıklarından faydalananlar var . Web sitesi kullanıcıları bu mekanizmayı çabucak kavrayıp sitelerinin arama motorlarında yükselmesini sağlamaya başladılar . Google bunu engellemek için çeşitli yöntemlere başvuruyor .Bu yüzden de , pagerank , bir sitenin Google arama sonuçlarında alacağı yeri belirleyen faktörlerden sadece biri .
Bununla birlikte , pagerank çoğu zaman paranın yerine geçiyor . "Sen bana pr4 iki bağlantı ver , ben sana pr5 bir bağlatı vereyim" tarzı safça tekliflere rastlanıyor .Halbuki sıradan bir bağlantı değişiminin hiçbir faydası yok . Örneğin bir araba sitesinden köpek bakımı sitesine verilen bağlantı , okura hiçbir katkısı olmadığı için hesaba katılmıyor .

images



SEO : Arama Motoru Optimizasyonu


İyi bir SEO'nun başlıca ilkesi , "doğru kodları ve mümkünse iyi ve benzersiz içeriği sağlamak" . Bu kurala uyan kişinin web sitesi aramalarda ilk sıraya yerleşiyor .
"Doğru kod " ifadesiyle kastettiğimiz , bir sayfanın HTML kodundaki iki özelliğe denk düşüyor . Her şeyden önce , sayfa kodunun sözdiziminde herhangi bir hata olmamalı ve ikinci olarak da , sadece mevcut HTML unsurları kullanılmalı . Google için özellikle de <title> ve <p> ile <h1>'DEN <H6>'ya giden etiketler önem taşıyor . <title> etiketinde belgenin kısa bir tanımı yer alıken , <p> etiketleri paragrafları düzenliyor .
Daha iyi arama sonuçlarının bir diğer koşulu da sabır . Diğer web siteleri sitenize yavaş yavaş bağlantı verdikçe , sitenizin popülerliği ve dolayısıyla da pagerankı yükseliyor .
İnce Ayar : Web sitesi için bağlantı hazırlama
Herkes bu sabra sahip değil elbette . Bunun için de çeşitli yollar var . Örneğin forumlarda ve bloglarda kendi sitenize giden bağlantılar verebilirsiniz . Ancak forum kullanıcıları bu tür kendini pazarlama girişimlerine hiç te hoş bakmıyor . Böyle bağlantılar , sadece forum okurlarına gerçekten hitap eden bilgiler veriyorsa işe yarıyor .
Daha iyi arama sonuçlarına giden bir başka yol ise neredeyse tamamen tıkalı . Blog yorumlarında tüm bağlantılara otomatik olarak "rel-follow" parametresi eşlik ediyor .Bu yüzden de Google bu bağlantıları takip etmiyor ve pagerankınız için verilmiş bir oy olarak sayılmıyor .



Bağlantı takibi : Her tıklama başına para


Eğer arama devi Google , kullanım desenini değerlendirmese aptallık ederdi . Çünkü tıklamaları takip ederek kullanıcıların hangi arama sonuçlarından memnun kaldığını belirlemek ve sıralamayı buna göre yapmak mümkün .
Bu değerlerin Google için önemi şu ; Kimsenin bu durumu değiştirememesi .Bu durumun tek istisnası , zirve yarışında kendine bir sürü bağlantı vermek , bir yandan da iyi seçilmiş başlıklar ve sayfa tanımları kullanmak .

google-time-cover.jpg


Kara şapkalı SEO : Google'ı oyuna getirenler


Her sistemin her programın bir zayıf noktası vardır ve Google de bundan nasibini alıyor .Arama motorları kullanıcıları web sitelerine gönderdiği, birtakım kötü niyetliler de arama sonuçlarını etkilemeye çalışıyor. Böylelikle , spamcilerle arama motoru kullanıcıları arasında bir mücadele başlıyor . Gruplardan biri manipülasyonla kısa yoldanköeyi dönmek isterken , diğeri ise temiz ve reklamsız sonuçlar istiyor .
Kara şakpalı SEO yöntemi , bu iş için Google'ın açıkarından faydalanıyor . Şu an spam için kullanılan yöntemleri içerik spami ve bağlantı spam'i olmak üzere ikiye ayırmak mümkün . İkisi de internette dolaşanları Google'da ilk sıralarda görüntülenen sonuçlarla belirli sitelere çekmek amacı güdüyor . Bu web sitelerinde sunulanların çoğu anlamlı göründüğünden , kullanıcı bağlantılara tıklıyor ve bu da spamcinin cebine para girmesini sağlıyor .
İçerik spaminin biok alt türü var . En basiti , sayfanın alt kısmını arama motorunun kaydedebileceği sözcüklerle doldurmak . Ancak bu yöntem eskiden olduğu kadar da işe yarar değil , zira arama motorları artık bir anahtar sözcüğün metinde kaç kez tekrarlandığına bakıyor . Google ve benzerleri , "Keyword Stuffing" (Anahtar sözcük kullanma) adlı bu yöntemden artık etkilenmiyor .Bunun için , metindeki sözcükleri birbiriyle olan ilişkilerine göre yerleşitrmek gerekiyor . Belirli bir eşiğin altındaki metinler doğrudan yığın posta olarak tanımlanabiliyor .
Google'yi kandırmak için kullanılan diğer bir yöntem ise gizli metin .Spamciler genelde beyaz arka yazı üzerine beyaz yazı yazıyor . HTML ya da CSS'te bunu yapmak hiç te sorun değil . Siteyi ziyarete gelen kişi aradığını bulamıyor , zira arama motoru sitedeki yüzlerce , hatta binlerce kelimeyi kaydetmiş oluyor . Bununla birlikte , arama motorları gizli metinlere karşı da donanımlı . Google'nin SEO konusunda gayrı resmi sözcüsü olan Matt Cutts'un blogunda , beyaz arka plan üzerine gri renk yazı yazarak hiçbiryere gelinemeyeceğini belirtmiş .
Bazı sitelerin içeriğinin aşırıldığı , yani izinsizce çalınıp kopyalandığı durumlar da var . Google , Adsense'den para kazanmak için kullanılan bu yönteme karşı da donanımlı .



Bağlantı Spami : Blogları çöplüğe çeviriyor


Blog ve forum kullanıcılarının kötü amaçlı bağlantı spaminden korunması gerekiyor . Kendi kurdukları bağlantı çiftlikleri artık çalışmadığı için , spamciler artık farklı yollara başvuruyor . Artık blogları , forumları ve web sitelerini bağlantı listeleriyle dolduruyorlar . Google'ın dört bir yanı çöple dolu olan sitelerle mücadeleye girişmesi de onların gözünü korkutmuyor . Zira çöplerini doldurabilecekleri sayısız alternatif bulabiliyorlar .
Bunun tek panzehiri , Google'ın yorumlarığı etiketler arasındaki "nofollow" özniteliği . Google bu şekilde işaretlenmiş sitelerin izini sürmüyor . Blog yazılımı "Wordpress" 'te bu özellik varsayılan olarak ayarlı . Bu spami önlemese de etkisini artırıyor . Spamciler ise oralı bile olmuyor . Nofollow etiketi olmayan blogları hef alıyorlar . Blogcular ise kendi yazdıkları ıanti spam rutinleriyle ya da Akismet gibi hizmetlerle bu saldırılara karşı koyuyor.



Gizleme : Spamcilerin yeni gözdesi


Arama motoru spamcilerinin başvurduğu yeni bir teknik ise "gizlenme" (cloak) adını taşıyor .Böylece web sitesinin esas yüzü gizleniyor . Arama motoru , siteyi okurlara farklı bir içeriğe sahip gibi tanıtıyor . Web sitelerini arama işini üstlenen "Google bot"u tespit ediliyor ve gizlenen kişi , IP adresinden de bu botu tanıyabiliyor .
Gizlenen site sadece Goog Bot'u tanıyor ve ona , arama motoruna iletmesi için gizli bir içerik sağlıyor . Okur siteye ulaştığında ise buranın aslında arama sorgusuyla hiç te alakalı olmadığını görüyor .
Site yönlendirme de bu şekilde işliyor . Sayfanın yüklenişinin ard , Meta etiketi ya da JavaScrip aracılığıyla , ziyaçi bir başka siteye yönlendiriliyor . JavaScrip'i yorumlayamayan Google Bot'u , sadece başlangıç sayfasına takılıyor .
Kamuoyu bu yöntemn , 2005 Şubat'ında BMW sitesi Google'ın dizininden çıkarıldığında haberdar oldu . (http://www.mattcutts.co/blog/ramping-up-international-webspam) . Araba üreticisi JavaScript ile yönlendirmeye başvurmuştu ve Google bota arama sözcükleriyle dolu bir metin sayfasını , kullanıcıya ise araba resimleri gösteriyordu.



Bu yazı , CHİP dergisinin Google Matematiği başlıklı yazısından , derlenmiştir .
Eklemeler ve orjinal belgeye gurkem.com adresinden ulaşabilirsiniz
 

Tırtıl

0
İyinet Üyesi
Katılım
22 Ekim 2007
Mesajlar
615
Reaction score
0
Konum
Bursa
Güzel fikilerler var, teşekkürler.
Aslında bunları neredeyse bilmeyen yok ama iş uygulamaya gelince tıkanıp kalıyoruz. Alışmışız "kopyala, yapıştır" yapmaya.
 

Gur.Kem

0
İyinet Üyesi
Katılım
21 Temmuz 2008
Mesajlar
454
Reaction score
1
Güzel fikilerler var, teşekkürler.
Aslında bunları neredeyse bilmeyen yok ama iş uygulamaya gelince tıkanıp kalıyoruz. Alışmışız "kopyala, yapıştır" yapmaya.

Kopyala yapıştır ? Yazının derlendiği kaynakları yazmamı istermisin ?
 

Tırtıl

0
İyinet Üyesi
Katılım
22 Ekim 2007
Mesajlar
615
Reaction score
0
Konum
Bursa
Kopyala yapıştır ? Yazının derlendiği kaynakları yazmamı istermisin ?


Yuhh! Bu yazdıklarımdan o anlam çıkıyorsa kusura bakma. Sana emeklerin için teşekkür ederm ancak ben o kopyala yapıştırı bizim türk webmaster'lara demek istedim.

Velhasıl-ı kelam, emeklerin için teşekkür ederim. Gerçekten çok değerli bilgiler var ancak bunları yalayıp yutsak da zihniyet değişmedikçe emek vermedikçe değişen bir şey olmayacak.
 

uyuz

0
İyinet Üyesi
Katılım
31 Aralık 2003
Mesajlar
2,515
Reaction score
0
geçen dönem aldığım bir dersteki final sorularından biriydi bu algoritma :)
 

Ozcan

0
İyinet Üyesi
Katılım
12 Mayıs 2007
Mesajlar
3,749
Reaction score
59
Konum
Antalya
:) bencede çok güzel ama boşuna yazmışsın bunu sadece uygulayan kişiler okur uygulamayan adamın zaten umrunda olmaz. problemde burda zaten. böyle yazıları zorla okutmak lazım ama okusada bi şey anlarmı bilemiyorum.
 

Gur.Kem

0
İyinet Üyesi
Katılım
21 Temmuz 2008
Mesajlar
454
Reaction score
1
Yuhh! Bu yazdıklarımdan o anlam çıkıyorsa kusura bakma. Sana emeklerin için teşekkür ederm ancak ben o kopyala yapıştırı bizim türk webmaster'lara demek istedim.

Velhasıl-ı kelam, emeklerin için teşekkür ederim. Gerçekten çok değerli bilgiler var ancak bunları yalayıp yutsak da zihniyet değişmedikçe emek vermedikçe değişen bir şey olmayacak.

Özür dilerim yanlış anlamışım :)
 
X

Xman

Misafir
Anlatılanların hepsini yaladık yuttuk :) ama yeni başlayanlar için güzel bir anlatım olmuş ;)
 

Türkiye’nin ilk webmaster forum sitesi iyinet.com'da forum üyeleri tarafından yapılan tüm paylaşımlardan; Türk Ceza Kanunu’nun 20. Maddesinin, 5651 Sayılı Kanununun 4. maddesinin 2. fıkrasına göre, paylaşım yapan üyeler sorumludur.

Üst