Arkadaşlar merhaba,
Forumda da araştırdım ama hemen hemen hep aynı sorular sorulup durulmuş, bu yüzden Direkt olarak Googledan alınmış ve tercüme edilmiş Sitemap FAQ sunu buraya yazmak istedim. Birebir çevirinin yanında yazının içine kendi yorumlarımı ve bazı tavsiyeleride ekledim. Umarım işinize yarar..
Soru: Sitemap da ki urllerim nasıl olmalı
Cevap: Sitemapda kullanacağınız URL ler RFC-3986 URI standardına uygun olmalı. Eğer sitemapınızı bir program/script sayesinde oluşturuyorsanız URLlerdeki >,',",& gibi karakterleri URL standartlarındaki gibi değiştirmelisiniz.
Örneğin: http://www.example.com/view?widget=3&count>2
Olması gereken: http://www.example.com/view?widget=3&count>2
Soru:Sitemapımda istediğim karakter kodlamasını kullabilirmiyim veya hangi karakter kodlamasını kullanmamı önerirsiniz ?
Cevap: Sitemapınızın UTF-8 karakter kodlamasında olmalıdır...
Tavsiye: eğer yapabiliyorsanız sadece sitemapınızı değil sitenizin bütün kodlamalarını UTF-8 olarak yapın.
Soru: Zamanı nasıl göstermeliyim
Cevap:Zamanı göstermek için W3 Konsorsiyomunun Tarih Zaman Kodlamasını kullanın.. Örneğin: 2004-09-22T14:12:14+00:00 gibi.
Aslında yukarıdaki format ISO8601 formatını kullanmanızı gerektirmez. Örnek olarak 2004-09-22 tarih bilgiside bizim için geçerlidir ancak eğer siteniz devamlı değişiyorsa GoogleBotları yukarıdaki detaylı bilgiye göre siteniz hakkında daha detaylı bilgiye sahip olur.
Yani: diyorki W3 Konsorsiyomunun Tarih Zaman Kodlamasını kullanmanız sizin yararınıza.Sonuçta birinde sadece gun ay ve yılı bildiriyoruz diğerinde ise saniyesine kadar botlara bilgi veriyoruz.
Soru:Sayfaların son değiştirlme tarihini nasıl bulabilirim ?
Cevap: Statik sayfalarınız (dosyalarınız) için
Şeklinde Unix (*Nix demek daha uygun) komutunu kullanabilirsiniz.
Dinamik Dosyalarınız için ise önemli olan o urlde gösterilen verinin değişip değişmemesidir. Bunuda veritabanından alabilirsiniz diyor.
Tavsiye: Dinamik urlleriniz için yukarıdaki olayın yapılması biraz zor olduğundan çakma bir yöntem olarak sitenizin dinamik dosyalarını 2-3 günde bir silip yeniden atın....
Soru:Sitemapımı nereye yuklemem gerekir ?
Cevap: Sitemapınızı Webserverının webservisine açılmış kök dizinine atmanızın en iyi olduğunu söylüyor google. Örneğin http://www.abc.com/sitemap.xml
Soru: (Bence en çok yalnış yapılan nokta) Sitemapımın büyüklüğü ne olmalıdır ?
Sitemapınız 10MB (10,485,760 bytes) tan daha büyük olmamalıdır. 10 MB dan küçük olsa dahi içinde en fazla 50.000 URL bulunmalıdır.
Eğer siteniz çok buyukl bir site ise ve yukarıdaki kısıtlamalar sizi engelliyorsa, birden fazla sitemap kullanabilirsiniz...
ör:http://domain.com/sitemap1.xml
ör:http://domain.com/sitemap2.xml
Ayrıca son nokta yukarıdaki 10 mb boyut sınırlaması; sitemapınızı gzip le sıkıştırsanız dahi açıldığında (extract) elde edilen dosya boyutudur. Örneğin:12 MB lık bir sitemapınızı gnzip le sıkıştırdınız ve elde edilen dosya 2 MB oldu ve içindede 32.000 URL var.Tamam ben kurallara uydum diyemessiniz cunku gzip dosyası açıldığında dosya boyutunuz 12MB olacaktır....
.... Uykum geldi devam edeceğim....
Forumda da araştırdım ama hemen hemen hep aynı sorular sorulup durulmuş, bu yüzden Direkt olarak Googledan alınmış ve tercüme edilmiş Sitemap FAQ sunu buraya yazmak istedim. Birebir çevirinin yanında yazının içine kendi yorumlarımı ve bazı tavsiyeleride ekledim. Umarım işinize yarar..
Soru: Sitemap da ki urllerim nasıl olmalı
Cevap: Sitemapda kullanacağınız URL ler RFC-3986 URI standardına uygun olmalı. Eğer sitemapınızı bir program/script sayesinde oluşturuyorsanız URLlerdeki >,',",& gibi karakterleri URL standartlarındaki gibi değiştirmelisiniz.
Örneğin: http://www.example.com/view?widget=3&count>2
Olması gereken: http://www.example.com/view?widget=3&count>2
Soru:Sitemapımda istediğim karakter kodlamasını kullabilirmiyim veya hangi karakter kodlamasını kullanmamı önerirsiniz ?
Cevap: Sitemapınızın UTF-8 karakter kodlamasında olmalıdır...
Tavsiye: eğer yapabiliyorsanız sadece sitemapınızı değil sitenizin bütün kodlamalarını UTF-8 olarak yapın.
Soru: Zamanı nasıl göstermeliyim
Cevap:Zamanı göstermek için W3 Konsorsiyomunun Tarih Zaman Kodlamasını kullanın.. Örneğin: 2004-09-22T14:12:14+00:00 gibi.
Aslında yukarıdaki format ISO8601 formatını kullanmanızı gerektirmez. Örnek olarak 2004-09-22 tarih bilgiside bizim için geçerlidir ancak eğer siteniz devamlı değişiyorsa GoogleBotları yukarıdaki detaylı bilgiye göre siteniz hakkında daha detaylı bilgiye sahip olur.
Yani: diyorki W3 Konsorsiyomunun Tarih Zaman Kodlamasını kullanmanız sizin yararınıza.Sonuçta birinde sadece gun ay ve yılı bildiriyoruz diğerinde ise saniyesine kadar botlara bilgi veriyoruz.
Soru:Sayfaların son değiştirlme tarihini nasıl bulabilirim ?
Cevap: Statik sayfalarınız (dosyalarınız) için
Kod:
$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00
Dinamik Dosyalarınız için ise önemli olan o urlde gösterilen verinin değişip değişmemesidir. Bunuda veritabanından alabilirsiniz diyor.
Tavsiye: Dinamik urlleriniz için yukarıdaki olayın yapılması biraz zor olduğundan çakma bir yöntem olarak sitenizin dinamik dosyalarını 2-3 günde bir silip yeniden atın....
Soru:Sitemapımı nereye yuklemem gerekir ?
Cevap: Sitemapınızı Webserverının webservisine açılmış kök dizinine atmanızın en iyi olduğunu söylüyor google. Örneğin http://www.abc.com/sitemap.xml
Soru: (Bence en çok yalnış yapılan nokta) Sitemapımın büyüklüğü ne olmalıdır ?
Sitemapınız 10MB (10,485,760 bytes) tan daha büyük olmamalıdır. 10 MB dan küçük olsa dahi içinde en fazla 50.000 URL bulunmalıdır.
Eğer siteniz çok buyukl bir site ise ve yukarıdaki kısıtlamalar sizi engelliyorsa, birden fazla sitemap kullanabilirsiniz...
ör:http://domain.com/sitemap1.xml
ör:http://domain.com/sitemap2.xml
Ayrıca son nokta yukarıdaki 10 mb boyut sınırlaması; sitemapınızı gzip le sıkıştırsanız dahi açıldığında (extract) elde edilen dosya boyutudur. Örneğin:12 MB lık bir sitemapınızı gnzip le sıkıştırdınız ve elde edilen dosya 2 MB oldu ve içindede 32.000 URL var.Tamam ben kurallara uydum diyemessiniz cunku gzip dosyası açıldığında dosya boyutunuz 12MB olacaktır....
.... Uykum geldi devam edeceğim....