Robots.txt adalah Sebuah file
dengan sebuah fungsi yang di gunakan untuk membatasi akses robot mesin pencari
(Search engine misal : Google,Bing,Yahoo,dll) yang sedang menjelajahi atau membuka
situs web yang anda miliki. Sebelum mereka mejelajahi halaman web, mereka
memeriksa terlebih dahulu untuk melihat apakah sebuah file robots.txt ada atau
kah tidak, dan di dalam robots.txt ada perintah (command) yang mencegah mereka
mengakses untuk halaman tertentu.
Kita memerlukan robots.txt agar
robot-robot itu tidak mengindex halaman di search engine (Google,yahoo,Bing)
yang tidak kita inginkan , karena mungkin ada beberapa halaman web yang tidak
ingin di index oleh search engine. Dan jika kita ingin semua content di web
kita di index oleh mesin pencari kita tidak membutuhkan robots.txt
Dalam hal optimasi SEO, kemampuan Robots.txt yang dapat mengarahkan spider bot
mengcrawling halaman yang ditargetkan bisa kita manfaatkan untuk mengarahkan
spider bot pada halaman penting seperti halaman konten agar konten tersebut
cepat terindex oleh search engine.
Saat spider bot
memutuskan untuk mengcrawl situs, situs akan kehilangan bandwidth dalam jumlah
yang tidak sedikit. Bila beberapa directory tertentu misal pada directory
search kita batasi aksesnya maka ini akan menghemat bandwidth dan kegagalan
spider bot dalam mengcrawl blog kita karena akses situs yang kurang baik akan
teratasi sehingga spider bot bisa dengan leluasa merayapi seluruh isi konten
sampai tuntas.
Di lain sisi
bila halaman index yang di dapat search
engine pada sebuah situs dinilai sangat berkualitas maka situs
tersebut akan memiliki peluang besar untuk masuk halaman pertama. Hal ini akan
berbeda jauh hasilnya dibandingkan dengan situs yang memiliki banyak halaman
index namun dengan konten yang kurang berkualitas dan cenderung hanya
menampilkan banyak link didalamnya contonya situs AGC
Berikut ini cara mengaktifkannya pada blog,
mungkin semua sudah tidak asing lagi dengan yang namanya Custom robots.txt,
dengan mensetting Custom robots.txt maka hal tersebut
bertujuan agar blog kita mudah
dikenal oleh Robot search engine, simak berikut ini
Warning:
Pengaturan Custom robots.txt yang baik dan benar akan membantu blog sobat terindex dengan baik pula, namun salah dalam penyetingan akan berakibat fatal alias buruk untuk blog sobat. So let's try this Custom robots.txt out!
Cara setting Custom robots.txt yang baik dan benar:
1. Login ke blogger
2. Pilih menu setting => Search preferences
3. lihat ke menu Crawlers and indexing, klik edit pada Custom robots.txt
4. Isi pada kotak kosong dengan text berikut (jangan lupa centang yes pada Enable custom robots.txt content?):
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://www.putiku.blogspot.com/feeds/posts/default?orderby=UPDATED
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://www.putiku.blogspot.com/feeds/posts/default?orderby=UPDATED
NB:
Ganti putiku.blogspot.com dengan alamat blog/web sobat
5. Klik Save Changes, selesai.
Sekarang Custom robots.txt blog sobat telah aktif. Semoga bermanfaat
{ 0 komentar... Views All / Send Comment! }
Post a Comment