Friday, November 13, 2009

Search Engine

Search Engine (=Mesin Pencari) adalah sebuah program yang didisain untuk membaca kumpulan kata-kata yang diambil dari situs-situs web. Biasanya sebuah software (dikenal sebagai robot/spider) ditugaskan untuk membaca seluruh atau sebagian kata-kata di sana (mungkin juga mengikuti links yang ada di situs tersebut). Hasilnya akan disimpan di dalam sebuah indeks. Selain itu, Search Engine juga memperoleh keberadaan sebuah situs dari URL yang disubmit oleh pemiliknya. Beberapa waktu kemudian, robot/spider akan membaca situs tersebut dan hasilnya akan disimpan ke dalam indeks. Indeks inilah yang digunakan Search Engine untuk menjawab pertanyaan yang diajukan.


Spider, robot ataupun web crawler menelusuri internet dengan membaca historical list (misalnya dari daftar server yang ada di internet), kemudian membuat rangking diantara situs-situsnya. Berdasarkan urutan inilah spider menjelajah internet.
Search Engine melakukan pengindeksan berdasarkan apa yang ada di situs (natural language). Tidak ada penyaringan lagi (kecuali untuk Meta Tag). Karena itulah search engine paling tepat jika digunakan untuk mencari informasi/konsep yang sudah jelas terdefinisi dan konsep tersebut sudah banyak digunakan. Kita tinggal menyebutkan konsep/istilahnya, kemudian search engine akan memberitahu dimana konsep itu berada. Namun ada juga search engine yang memiliki fasilitas tambahan, seperti Excite yang memiliki fasilitas penggunaan sinonim. Jadi, bila Anda mencari informasi cycling, Excite juga akan mencari bicycling Di lain pihak, search engine juga memiliki informasi yang sudah tidak up-to-date lagi. Penyebabnya adalah search engine belum melakukan pengecekan ulang lagi. Keterbatasan search engine lainnya: tidak dapat memberikan informasi on-the-fly (yang dibuat karena eksekusi program).

Faktor-faktor yang menentukan kehandalan Search Engine :
1. Ukuran database: Banyaknya URL dan kata-kata yang diindeks.
2. Jenis Resource yang diliput: Apakah hanya informasi dari web atau termasuk newsgroup dan ftp
3. Kedalaman Pengindeksan: Tidak mungkin seluruh internet bisa diindeks. Oleh karena itu, beberapa spider hanya membatasi pengindeksan untuk beberapa dokumen dalam satu situs. Ada juga yang hanya mencatat paragraf pertama, halaman pertama atau hanya 100 kata pertama.
4. Fasilitas : Kini search engine berlomba menawarkan penggunaan yang termudah. Mereka pun kini berlomba-lomba untuk menambah fasilitasfasilitasnya yang lain.

No comments:

Post a Comment

Please leave your comment

Bookmark and Share