İyinet'e Hoşgeldiniz!

Türkiye'nin En Eski Webmaster Forum'una Hemen Kayıt Olun!

Kayıt Ol!

Robots.txt dosyasını kullanarak sayfaları engelleme veya kaldırma

ertunc_58

0
İyinet Üyesi
Onaylı Üye
Katılım
16 Şubat 2008
Mesajlar
86
Reaction score
11
Robots.txt dosyasını kullanarak sayfaları engelleme veya kaldırma

Googlebot'un sitenizdeki sayfaları taramasını önlemek için bir robots.txt dosyası kullanabilirsiniz.

Örneğin, robots.txt dosyasını el ile oluşturuyorsanız, Googlebot'un belirli bir dizindeki (örneğin lemurlar) tüm sayfaları taramasını önlemek için aşağıdaki robots.txt girişini kullanırsınız:

User-agent: Googlebot
Disallow: /lemurlar

Googlebot'un belirli bir dosya türündeki (örneğin .gif) tüm dosyaları taramasını engellemek için aşağıdaki robots.txt girişini kullanabilirsiniz:

User-agent: Googlebot
Disallow: /*.gif$

Googlebot'un ? içeren URL'leri taramasını engellemek için (daha açık belirtmek gerekirse, etki alanı adınızla başlayan ve ardından herhangi bir dize, bir soru işareti ve herhangi bir dize gelen URL'leri) taramasını engellemek için):

User-agent: Googlebot
Disallow: /*?

robots.txt tarafından engellenen içerik sayfalarını taramamamıza veya dizinlerini oluşturmamamıza karşın, bunları web üzerindeki diğer sayfalarda bulduğumuz takdirde URL'leri tarayıp dizinlerini oluşturabiliriz. Sonuç olarak, sayfanın URL'si ve büyük olasılıkla herkesin kullanımına açık olan site bağlantılarındaki metin veya Açık Dizin Projesi'nden bir başlık gibi (www.dmoz.org) diğer bilgiler Google arama sonuçlarında görünebilir. Ancak, sayfalarınızın hiçbir içeriği taranmaz, dizine eklenmez veya görüntülenmez.

Bir sayfanın, başka sitelerde bu sayfa için bağlantı olsa bile Google dizinine eklenmesini bütünüyle önlemek için bir noindex meta etiketi kullanın ve sayfanın robots.txt dosyasında görünmemesini sağlayın. Googlebot sayfayı taradığında, noindex meta etiketini tanır ve URL'yi dizinden çıkarır.
 

ertunc_58

0
İyinet Üyesi
Onaylı Üye
Katılım
16 Şubat 2008
Mesajlar
86
Reaction score
11
User-agent: Googlebot
Disallow: /subat/files/search
 

ata350

0
İyinet Üyesi
Katılım
4 Aralık 2010
Mesajlar
1,964
Reaction score
35
Konum
Memleketin orta yerleri
Googlebot'un ? içeren URL'leri taramasını engellemek için (daha açık belirtmek gerekirse, etki alanı adınızla başlayan ve ardından herhangi bir dize, bir soru işareti ve herhangi bir dize gelen URL'leri) taramasını engellemek için):

User-agent: Googlebot
Disallow: /*?



Bunun hakkında örnek verirmisin ?
 

Eif

0
İyinet Üyesi
Katılım
26 Ocak 2005
Mesajlar
7,944
Reaction score
249
yararlı paylaşım :harika:

Ayrıca robots.txt den bahsetmişken mutlaka robots.txt ye sitemap urlsi eklemek gerekir.

En alta

Sitemap: http://siteadresi/sitemap.xml

Bu şekilde arama motorları sitemap adresini otomatik algılayıp, siteyi daha kolay tarayacaklar.
 

Maxer35

0
İyinet Üyesi
Katılım
23 Kasım 2010
Mesajlar
52
Reaction score
0
teşekkürler verdiğiniz bilgilerle robots.txt oluşturdum.
 

mbugrad

0
İyinet Üyesi
Katılım
12 Mart 2011
Mesajlar
293
Reaction score
0
merhaba daha önceden başkası tarafından kayıt edilmiş bir domaini satın aldım, domain bir süre park ta kalmış ve google dizininde şuan ww8 . domainim . com şeklinde bir indexlenmiş sayfası var. bu sayfayı robots txt ile nasıl kaldırabilirim ;??? webmaster tools dan ur kaldırma isteği ancak www . domainim . com /kaldırmak-istediğim-sayfa seklinde verilebiliyor. Dolayısıyla ww8 . yı belirtemiyorum orada
 

Türkiye’nin ilk webmaster forum sitesi iyinet.com'da forum üyeleri tarafından yapılan tüm paylaşımlardan; Türk Ceza Kanunu’nun 20. Maddesinin, 5651 Sayılı Kanununun 4. maddesinin 2. fıkrasına göre, paylaşım yapan üyeler sorumludur.

Backlink ve Tanıtım Yazısı için iletişime geçmek için Skype Adresimiz: .cid.1580508955483fe5

Üst