Monday, November 16, 2009

History of google



Versi awal algoritma pencarian didasarkan sepenuhnya pada informasi yang disediakan oleh webmaster melalui meta tag pada kode html situs web mereka. Meta tag menyediakan informasi tentang konten yang terkandung pada suatu halaman web dengan serangkaian katakunci (keyword). Sebagian webmaster melakukan manipulasi dengan cara menuliskan katakunci yang tidak sesuai dengan konten situs yang sesungguhnya, sehingga mesin pencari salah menempatkan dan memeringkat situs tersebut. Hal ini menyebabkan hasil pencarian menjadi tidak akurat dan menimbulkan kerugian baik bagi mesin pencari maupun bagi pengguna internet yang mengharapkan informasi yang relevan dan berkualitas.

Larry Page dan Sergey Brin, dua mahasiswa doktoral ilmu komputer Universitas Stanford, berusaha mengatasi permasalahan tersebut dengan membangun Backrub, sebuah mesin pencari sederhana yang mengandalkan perhitungan matematika untuk memeringkat halaman web. Algoritma tersebut, yang dinamakan PageRank, merupakan fungsi matematika yang kompleks berupa kombinasi antara perhitungan jumlah link yang mengarah pada suatu halaman web dengan analisis atas kualitas masing-masing link tersebut. Berdasarkan prinsip kerja PageRank, secara umum bisa dikatakan bahwa halaman web yang memperoleh peringkat tinggi adalah halaman web yang banyak di-link oleh halaman web lain. Nilai PageRank juga akan semakin tinggi apabila halaman web yang mengarah kepadanya juga memiliki kualitas yang tinggi.

Backrub hanyalah sebuah permulaan. Pada tahun 1998 Page dan Brin mendirikan Google yang merupakan versi tingkat lanjut dari Backrub. Dalam waktu singkat Google memperoleh reputasi dan kepercayaan dari publik pengguna internet karena berhasil menyajikan hasil pencarian yang berkualitas (tidak dimanipulasi), cepat, dan relevan. PageRank lantas menjadi standar baik bagi mesin pencari lain maupun bagi webmaster yang berusaha agar situs webnya memperoleh nilai PageRank setinggi mungkin sehingga menempati posisi tertinggi pada hasil pencarian.

Sejak tahun 1997 perusahaan mesin pencari menyadari bahwa beberapa webmaster melakukan segala hal untuk dapat terindeks pada urutan teratas hasil pencarian, termasuk dengan cara-cara yang manipulatif dan ilegal. Infoseek, salah satu mesin pencari generasi pertama, melakukan perbaikan pada algortima mereka untuk mencegah manipulasi dengan meta tag yang tidak relevan.

Bagaimanapun, dalam beberapa hal mesin pencari juga menyadari nilai ekonomi yang besar dari peringkat hasil pencarian, dan mereka terkadang memiliki kepentingan terselubung dari aktivitas perusahaan SEO. Beberapa perusahaan mesin pencari mengirim perwakilan atau menjadi tamu pada event-event rutin yang diselenggarakan komunitas SEO.

Mesin pencari besar seperti Google dan Yahoo! menyediakan program dan panduan yang memungkinkan webmaster mengoptimalkan situsnya agar terindeks dengan baik. Google menyediakan aplikasi Webmaster Tool dan memperkenalkan sitemap berbasis XML standar mereka, sedangkan Yahoo! menyediakan program Site Explorer yang memungkinkan webmaster mendaftarkan URL situs, mengecek jumlah halaman web mereka yang telah terindeks di Yahoo!, dan melihat informasi link masuk. Namun demikian mesin pencari tidak mentolerir metode SEO yang manipulatif dan menghalalkan segala cara.

Dari ulasan di atas kita ketahui bahwa page rank itu berpatokan pada Google. Google menggunakan suatu metoda/algoritma canggih (yang tidak diketahui siapapun) dalam menentukan pentingnya sebuah halaman web. Semakin banyak halaman yang terindeks di dalam search engine itu, maka semakin besarlah peluang atau peringkat/posisi nya. simplenya Page rank mempunyai arti peringkat halaman.

Cara kerja

Sebuah situs akan semakin populer jika semakin banyak situs lain yang meletakan link yang mengarah ke situsnya, dengan asumsi isi/content situs tersebut lebih berguna dari isi/content situs lain. PageRank dihitung dengan skala 1-10.

Contoh: Sebuah situs yang mempunyai Pagerank 9 akan di urutkan lebih dahulu dalam list pencarian Google daripada situs yang mempunyai Pagerank 8 dan kemudian seterusnya yang lebih kecil.

Salah satu algoritma yang di ketahui publik (di publikasikan) adalah:
PR(A) = (1-d) / N + d ( ( PR(T1) / C(T1) ) + … + ( PR(Tn) / C(Tn)))

Dimana:

  • PR(A) adalah Pagerank halaman A
  • PR(T1) adalah Pagerank halaman T1 yang mengacu ke halaman A
  • C(T1) adalah jumlah link keluar (outbound link) pada halaman T1
  • d adalah damping factor yang bisa diberi antara 0 dan 1.
  • N adalah jumlah keseluruhan halaman web (yang terindex oleh google)

Friday, November 13, 2009

Google

Google sekarang telah menjadi search engine yang paling populer untuk menggali informasi yang dibutuhkan di internet. Sekarang bayangkan jika anda ingin membeli ponsel. Anda mungkin akan mencari di Google dengan keyword ” harga handphone nokia ”. Yang muncul di hasil pencarian Google mungkin nama toko ponsel yang memajang harga ponsel tersebut, meski anda belum tentu akan membeli di toko tersebut. Tapi dengan begitu anda akan tahu tentang toko itu, dan hal-hal lain yang mungkin akan menarik minat anda dari toko tersebut. Hal ini membuat orang jadi bernafsu untuk membuat halaman situsnya ada di halaman depan pencarian Google. Karena ada di halaman berikutnya, kecil kemungkinan untuk dilirik. Apa yang menentukan posisi situs anda di pencarian Google?

Google punya suatu algoritma perhitungan yang disebut dengan PageRank (PR). Makin tinggi PR, maka posisi halaman situs anda makin tinggi. PR sendiri memiliki range dari 0-10. Lalu, berapa nilai PR yang dibutuhkan agar halaman anda ada di depan? Jawabannya mungkin sedikit menyebalkan: relatif.

Google menampilkan databasenya berdasarkan kata kunci atau keyword. Seperti contoh di atas, ” harga handphone nokia ”. Berapa banyak situs yang menampilkan harga ponsel dengan merk itu? Mungkin banyak, atau mungkin juga tidak banyak. Kalau banyak, halaman anda bersaing dengan banyak situs lainnya. Artinya, anda mungkin butuh PR yang tinggi. Mungkin 5 bahkan masih kurang. Tapi jika hanya satu-dua yang punya kata kunci seperti itu, anda mungkin hanya butuh PR 1 untuk tampil di depan.

Masih belum jelas? Misalnya halaman situs anda punya kata kunci ” harga handphone nokia ” dengan PR 2. Ada 5 situs lain yang punya kata kunci sama. Masing-masing PR-nya 5, 3, 1, 1 dan 0. Artinya, halaman anda akan muncul di atas yang punya PR 0 dan 1, tapi di bawah PR 3 dan 5. Halaman anda masih punya peluang untuk muncul di halaman depan! Sebaliknya, jika halaman anda punya PR 4, sementara saingan anda ada puluhan. Dan rata-rata PR-nya 4 sampai 7. Halaman anda akan ada di bawah puluhan halaman situs lain. Dan mungkin sekali terlempar dari halaman depan Google Search.

Kemudian akan muncul pertanyaan, bagaimana cara Google memberikan rangking ke halaman kita? Coba kita bayangkan seperti ini.

Misalkan anda menemukan warung makan burjo yang paling enak dan murah. Dan anda merekomendasikan ke teman anda. Kemudian teman anda mencobanya, dan ternyata dia senang. Karena suka, teman anda merekomendasikan ke teman yang lain, dan makin banyak yang menyukainya dan merekomendasikannya, maka warung makan burjo itu jadi makin populer.

Pagerank juga bekerja seperti itu. Makin banyak yang merekomendasikan satu halaman situs, maka Google akan menganggap halaman itu makin penting. Ini yang ditunjukkan dengan PR. Bagaimana cara orang merekomendasikan situs? Dengan link. Orang banyak merekomendasikan situs dengan memberikan link melalui email, mailing list, forum, website, dan blog. Makin banyak link yang ditemukan, makin tinggi PR halaman anda.

Artinya, jika situs anda memang berbobot dan disukai orang, sebetulnya anda tidak perlu berpikir tentang cara meningkatkan PR. Justru rasanya berusaha meningkatkan PR dengan memasang link dimana-mana, termasuk dengan membayar di situs populer, agak curang dan dapat merugikan. Artinya anda berusaha membuat situs anda tampak populer, meski tidak banyak yang merekomendasikannya.

Pada akhirnya, hal ini menunjukkan bahwa kualitas harus diutamakan. Jika anda menjual content, content anda harus bermutu agar disukai orang. Jika anda mempromosikan usaha anda, usahakan reputasi usaha anda bagus, agar direkomendasikan orang. Toh, jika anda ngetop lewat Google search tanpa memperhatikan mutu situs dan usaha anda, tidak ada gunanya jika mereka kecewa dengan apa yang anda berikan.




Search Engine

Search Engine (=Mesin Pencari) adalah sebuah program yang didisain untuk membaca kumpulan kata-kata yang diambil dari situs-situs web. Biasanya sebuah software (dikenal sebagai robot/spider) ditugaskan untuk membaca seluruh atau sebagian kata-kata di sana (mungkin juga mengikuti links yang ada di situs tersebut). Hasilnya akan disimpan di dalam sebuah indeks. Selain itu, Search Engine juga memperoleh keberadaan sebuah situs dari URL yang disubmit oleh pemiliknya. Beberapa waktu kemudian, robot/spider akan membaca situs tersebut dan hasilnya akan disimpan ke dalam indeks. Indeks inilah yang digunakan Search Engine untuk menjawab pertanyaan yang diajukan.


Spider, robot ataupun web crawler menelusuri internet dengan membaca historical list (misalnya dari daftar server yang ada di internet), kemudian membuat rangking diantara situs-situsnya. Berdasarkan urutan inilah spider menjelajah internet.
Search Engine melakukan pengindeksan berdasarkan apa yang ada di situs (natural language). Tidak ada penyaringan lagi (kecuali untuk Meta Tag). Karena itulah search engine paling tepat jika digunakan untuk mencari informasi/konsep yang sudah jelas terdefinisi dan konsep tersebut sudah banyak digunakan. Kita tinggal menyebutkan konsep/istilahnya, kemudian search engine akan memberitahu dimana konsep itu berada. Namun ada juga search engine yang memiliki fasilitas tambahan, seperti Excite yang memiliki fasilitas penggunaan sinonim. Jadi, bila Anda mencari informasi cycling, Excite juga akan mencari bicycling Di lain pihak, search engine juga memiliki informasi yang sudah tidak up-to-date lagi. Penyebabnya adalah search engine belum melakukan pengecekan ulang lagi. Keterbatasan search engine lainnya: tidak dapat memberikan informasi on-the-fly (yang dibuat karena eksekusi program).

Faktor-faktor yang menentukan kehandalan Search Engine :
1. Ukuran database: Banyaknya URL dan kata-kata yang diindeks.
2. Jenis Resource yang diliput: Apakah hanya informasi dari web atau termasuk newsgroup dan ftp
3. Kedalaman Pengindeksan: Tidak mungkin seluruh internet bisa diindeks. Oleh karena itu, beberapa spider hanya membatasi pengindeksan untuk beberapa dokumen dalam satu situs. Ada juga yang hanya mencatat paragraf pertama, halaman pertama atau hanya 100 kata pertama.
4. Fasilitas : Kini search engine berlomba menawarkan penggunaan yang termudah. Mereka pun kini berlomba-lomba untuk menambah fasilitasfasilitasnya yang lain.

Bookmark and Share