Monday, November 16, 2009

History of google



Versi awal algoritma pencarian didasarkan sepenuhnya pada informasi yang disediakan oleh webmaster melalui meta tag pada kode html situs web mereka. Meta tag menyediakan informasi tentang konten yang terkandung pada suatu halaman web dengan serangkaian katakunci (keyword). Sebagian webmaster melakukan manipulasi dengan cara menuliskan katakunci yang tidak sesuai dengan konten situs yang sesungguhnya, sehingga mesin pencari salah menempatkan dan memeringkat situs tersebut. Hal ini menyebabkan hasil pencarian menjadi tidak akurat dan menimbulkan kerugian baik bagi mesin pencari maupun bagi pengguna internet yang mengharapkan informasi yang relevan dan berkualitas.

Larry Page dan Sergey Brin, dua mahasiswa doktoral ilmu komputer Universitas Stanford, berusaha mengatasi permasalahan tersebut dengan membangun Backrub, sebuah mesin pencari sederhana yang mengandalkan perhitungan matematika untuk memeringkat halaman web. Algoritma tersebut, yang dinamakan PageRank, merupakan fungsi matematika yang kompleks berupa kombinasi antara perhitungan jumlah link yang mengarah pada suatu halaman web dengan analisis atas kualitas masing-masing link tersebut. Berdasarkan prinsip kerja PageRank, secara umum bisa dikatakan bahwa halaman web yang memperoleh peringkat tinggi adalah halaman web yang banyak di-link oleh halaman web lain. Nilai PageRank juga akan semakin tinggi apabila halaman web yang mengarah kepadanya juga memiliki kualitas yang tinggi.

Backrub hanyalah sebuah permulaan. Pada tahun 1998 Page dan Brin mendirikan Google yang merupakan versi tingkat lanjut dari Backrub. Dalam waktu singkat Google memperoleh reputasi dan kepercayaan dari publik pengguna internet karena berhasil menyajikan hasil pencarian yang berkualitas (tidak dimanipulasi), cepat, dan relevan. PageRank lantas menjadi standar baik bagi mesin pencari lain maupun bagi webmaster yang berusaha agar situs webnya memperoleh nilai PageRank setinggi mungkin sehingga menempati posisi tertinggi pada hasil pencarian.

Sejak tahun 1997 perusahaan mesin pencari menyadari bahwa beberapa webmaster melakukan segala hal untuk dapat terindeks pada urutan teratas hasil pencarian, termasuk dengan cara-cara yang manipulatif dan ilegal. Infoseek, salah satu mesin pencari generasi pertama, melakukan perbaikan pada algortima mereka untuk mencegah manipulasi dengan meta tag yang tidak relevan.

Bagaimanapun, dalam beberapa hal mesin pencari juga menyadari nilai ekonomi yang besar dari peringkat hasil pencarian, dan mereka terkadang memiliki kepentingan terselubung dari aktivitas perusahaan SEO. Beberapa perusahaan mesin pencari mengirim perwakilan atau menjadi tamu pada event-event rutin yang diselenggarakan komunitas SEO.

Mesin pencari besar seperti Google dan Yahoo! menyediakan program dan panduan yang memungkinkan webmaster mengoptimalkan situsnya agar terindeks dengan baik. Google menyediakan aplikasi Webmaster Tool dan memperkenalkan sitemap berbasis XML standar mereka, sedangkan Yahoo! menyediakan program Site Explorer yang memungkinkan webmaster mendaftarkan URL situs, mengecek jumlah halaman web mereka yang telah terindeks di Yahoo!, dan melihat informasi link masuk. Namun demikian mesin pencari tidak mentolerir metode SEO yang manipulatif dan menghalalkan segala cara.

Dari ulasan di atas kita ketahui bahwa page rank itu berpatokan pada Google. Google menggunakan suatu metoda/algoritma canggih (yang tidak diketahui siapapun) dalam menentukan pentingnya sebuah halaman web. Semakin banyak halaman yang terindeks di dalam search engine itu, maka semakin besarlah peluang atau peringkat/posisi nya. simplenya Page rank mempunyai arti peringkat halaman.

Cara kerja

Sebuah situs akan semakin populer jika semakin banyak situs lain yang meletakan link yang mengarah ke situsnya, dengan asumsi isi/content situs tersebut lebih berguna dari isi/content situs lain. PageRank dihitung dengan skala 1-10.

Contoh: Sebuah situs yang mempunyai Pagerank 9 akan di urutkan lebih dahulu dalam list pencarian Google daripada situs yang mempunyai Pagerank 8 dan kemudian seterusnya yang lebih kecil.

Salah satu algoritma yang di ketahui publik (di publikasikan) adalah:
PR(A) = (1-d) / N + d ( ( PR(T1) / C(T1) ) + … + ( PR(Tn) / C(Tn)))

Dimana:

  • PR(A) adalah Pagerank halaman A
  • PR(T1) adalah Pagerank halaman T1 yang mengacu ke halaman A
  • C(T1) adalah jumlah link keluar (outbound link) pada halaman T1
  • d adalah damping factor yang bisa diberi antara 0 dan 1.
  • N adalah jumlah keseluruhan halaman web (yang terindex oleh google)

Bookmark and Share