• Tidak ada hasil yang ditemukan

Mesin Pencari (Search Engine)

Cari Tahu

Opera 10 Alpha Browser Tercepat di Masa Depan

1. Mesin Pencari (Search Engine)

Untuk mencari informasi yang Anda inginkan dan tidak tersesat di “rimba” data maupun informasi internet, ada dua metode yang biasanya digunakan untuk mencari jawaban dan pertanyaan yang Anda cari di internet. Metode pencarian tersebut adalah sebagai berikut.

a. Subject tree (indeks kategori atau subject category)

Subject tree adalah suatu metode pencarian dengan cara penelusuran dari subjek utama, kemudian makin lama makin menyempit hingga pada bagian dari subjek informasi yang diinginkan.

b. Search engine (mesin pencari atau mesin penelusur)

Dalam penggunaannya, Anda hanya perlu mengetikkan beberapa kata atau frasa (kata kunci) dari yang berkaitan dengan informasi yang akan Anda temukan dan Search Engine akan mencarikannya untuk Anda dari database yang jumlahnya jutaan. Penggunaan search engine ini lebih populer di kalangan user karena kemudahannya.

1) Sekilas tentang Mesin Pencari (Search Engine)

Mesin pencari adalah program komputer yang dirancang untuk membantu

seseorang menemukan ile-ile yang disimpan dalam komputer, misalnya dalam sebuah server umum di web (WWW) atau dalam komputer sendiri. Mesin pencari memungkinkan kita untuk meminta content media dengan

kriteria yang spesiik (biasanya yang berisi kata atau frasa yang kita tentukan) dan memperoleh daftar ile yang memenuhi kriteria tersebut.

Mesin pencari biasanya menggunakan indeks (yang sudah dibuat

sebelumnya dan dimutakhirkan secara teratur) untuk mencari ile setelah

Dalam konteks Internet, mesin pencari biasanya merujuk kepada WWW dan bukan protokol ataupun area lainnya. Selain itu, mesin pencari mengumpulkan data yang tersedia di newsgroup, database besar, atau direktori terbuka seperti DMOZ.org. Karena pengumpulan datanya dilakukan secara otomatis, mesin pencari berbeda dengan direktori Web yang dikerjakan manusia.

Mesin pencari adalah sebuah program yang digunakan sebagai alat bantu untuk mencari informasi di internet. Mesin pencari mempunyai sebuah database yang memuat semua item-item yang terdapat di internet dan halaman-halaman web yang menyimpan informasi yang berhubungan dengan item-item tersebut.

Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan dan mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang sering disebut algoritma pencarian. Kecepatan dan ketepatan pencarian sebuah mesin pencari tergantung kepada cara meng-indeks dan algoritma pencarian yang digunakan.

Struktur umum sebuah mesin pencari adalah sebagai berikut. a) Kotak teks pencarian

Kotak ini digunakan sebagai tempat memasukkan kata kunci yang akan dijadikan acuan pencarian.

b) Tombol pencarian

Tombol ini yang akan menjalankan perintah pencarian.

Informasi di internet setiap saat terus berubah dan bertambah. Oleh karena itu, sebuah mesin pencari harus terus memperbarui database yang dimilikinya. Untuk melakukan hal ini, mesin pencari dilengkapi sebuah program yang berfungsi seperti robot. Disebut robot karena dapat bekerja sendiri tanpa harus dijalankan atau diperintah terlebih dahulu. Program tersebut disebut spider, bot, atau crawler. Setiap

selang waktu tertentu program “robot” tersebut akan menjelajahi

Gambar .. Fitur mesin pencarian Google

internet, membaca dokumen-dokumen yang ada di dalam internet, meringkasnya, dan kemudian menyimpan di database dengan menggunakan sistem pengindeks.

Pada saat kita melakukan pencarian informasi di internet, komputer kita akan mengirim kata kunci pencarian ke server mesin pencari yang kita gunakan. Server mesin pencari akan melakukan pencarian dokumen web di database yang dimilikinya. Kata kunci pencarian kemudian disesuaikan dengan dokumen-dokumen yang ada di database. hasil pencarian tersebut kemudian disusun berdasarkan tingkat kesesuaiannya dengan kata kunci pencarian. Komputer server kemudian mengirimkan hasil pencarian ke komputer kita. Dengan demikian kita dapat memperoleh informasi yang kita cari dengan hasil yang up to date.

Untuk mendapatkan mesin pencari yang andal dan bagus sehingga dapat membantu Anda dalam suring informasi di internet, Anda harus memerhatikan kriteria-kriteria sebagai berikut.

a) Mengetahui cara kerja mesin pencari, sehingga Anda dapat mengeksploitasi kelebihan mesin pencari tersebut.

b) Mempunyai database yang besar dan sering diperbarui.

c) Tidak memiliki spam (pengiriman berantai), sehingga memberikan hasil pencarian yang relevan.

d) Mempunyai kecerdasan buatan yang baik, sehingga mengerti apa yang kita cari.

2) Macam-macam mesin pencari (search engine)

Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan dan database tertutup. Mesin yang paling populer adalah Google (MSN Search dan Yahoo! tertinggal sedikit di belakang).

Saat ini banyak sekali website yang menyediakan mesin pencari. Setiap mesin pencari memiliki kelebihan sendiri-sendiri, tergantung cara pengindeksian dan algoritma pencarian yang digunakan.

Berdasarkan cara mengumpulkan data halaman-halaman web, mesin pencari dapat dikelompokkan menjadi empat kategori, yaitu dikelola manusia (human organized), dikelola komputer (computer created), campuran (hybrid), dan metacrawler/metasearch.

a) Human organized search engine

Karakteristik mesin pencarian ini menggunakan basis data halaman web yang dikelola oleh manusia. Datanya dipilih yang relevan dan dikelompokkan sedemikian sehingga lebih bermakna dan bermanfaat bagi penggunanya. Situs ini dalam praktiknya mempekerjakan para pakar dalam bidang-bidang tertentu, kemudian para pakar tersebut dapat mengelompokkan situs-situs tertentu sesuai dengan bidangnya.

Tabel. 2.2. Macam-macam search engine human organized Search engine Tahun

Peluncuran Alamat Situs

Yahoo! 1994 www.yahoo.com

LookSmart 1996 www.looksmart.com

About 1987 www.about.com

Open Directory 1998 Dmoz.org

b) Computer created search engine

Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan informasi walaupun kadang-kadang ada beberapa informasi yang tidak relevan seperti yang kita inginkan. Search engine ini telah menggunakan software laba-laba atau Spider software yang berfungsi untuk menyusup pada situs-situs tertentu, kemudian mengumpulkan data serta mengelompokkan dengan sedikit bantuan tangan manusia.

Tabel. 2.3. Macam-macam search engine computer created

Search engine Tahun

Peluncuran Alamat Situs

WebCrawler 1994 www.webcrawler.com

Excite 1995 www.excite.com

Inktomi 1996 www.inktomi.com

Northern Light 1997 www.northernlight.com

Fast Search 1999 www.altheweb.com

c) Hybrid search engine

Hybrid merupakan gabungan antara tangan manusia dengan komputer, sehingga menghasilkan hasil pencarian yang relatif akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam proses pengkoleksian database halaman web.

Tabel. 2.4. Macam-macam search engine hybrid

Search engine Tahun

Peluncuran Alamat Situs

Lycos 1995 www.lycos.com

Alta Vista 1995 www.altavista.com

HotBot 1996 www.hotbot.com

Go To 1997 www.goto.com

Snap 1997 www.snap.com

Direct Hit 1998 www.directthit.com

Google 1998 www.google.com

d) Metacrawler/metasearch

Metacrawler/metasearch merupakan perantara dengan mesin pencari yang sebenarnya. Situs ini hanya akan mengirimkan permintaan pencarian ke berbagai mesin pencarian serta menampil- kan hasilnya menjadi satu di layer browser.

Tabel. 2.5. Macam-macam search engine metacrawler/metasearch

Search engine Tahun

Peluncuran Alamat Situs

SavvySearch 1995 savvysearch.com

Dogpile Tidak

terindentiikasi www.dogpile.com

The Big Hub Tidak

terindentiikasi www.inind.com

C4 Total Search Tidak

terindentiikasi www.snap.com

Namun, dari kesekian macam search engine (mesin pencari) tersebut yang populer tingkat dunia adalah dari golongan hybrid search engine. Berikut adalah karakteristik dari search engine tersebut.

a) Altavista (www.altavista.com)

Didirikan oleh digital corp. altavista mempunyai kelebihan dalam pencarian canggih (advanced search) dengan menggunakan operator

Boolean AND, OR, (), NOT, NEAR,”, dan *.

Kata AND atau sering disimbolkan dengan (+) digunakan untuk memfokuskan pencarian, misalnya seorang seniman yang ingin mencari informasi terkait dengan kejadian-kejadian kesenian di Surabaya pada tahun 2008. Dengan tidak memanfaatkan

tanda “+” tersebut, ia dapat memasukkan searching key dengan format seperti berikut: +surabaya+kesenian+program+2008. Cara ini tentu saja jauh lebih efektif daripada hanya mengguna- kan searching surabaya, kesenian yang hasilnya akan berupa jutaan link ke situs yang mengandung kata-kata tersebut.

Simbol “+” ini dapat dipergunakan sebanyak-banyaknya,

karena prinsip yang kerap dipergunakan dalam searching di

internet adalah bahwa semakin spesiik yang dicari (semakin banyak menggunakan tanda “+”) berarti semakin baik pula suatu pencarian. Dengan searching key yang semakin spesiik,

hasil yang ditampilkan search engine akan lebih terfokus. Simbol-simbol boolean banyak dipergunakan oleh mereka yang memiliki latar belakang ilmu komputer atau yang terbiasa mengakses sistem basis data (database) konvensional. Secara garis besar, beberapa simbol boolean yang penting, oleh beberapa kalangan dinilai sudah terlalu kuno dan ketinggalan zaman, sebenarnya sudah terwakili dengan simbol-simbol matematika seperti yang

telah dijelaskan sebelumnya. Kelebihan dari simbol boolean adalah simbol ini dapat merepresentasikan jenis pencarian yang tergolong kompleks karena memiliki simbol-simbol tambahan.

Simbol penting yang lain yang kerap dipergunakan oleh para netter untuk membantu proses pencarian dijelaskan dengan uraian berikut. Simbol pertama adalah kata OR (mengandung pengertian

“atau” dalam bahasa Indonesia). Simbol ini bekerja dengan cara

yang sama dengan karakter spasi pada simbol matematika. Jika

seseorang melakukan pencarian dengan searching key “suku- suku OR Indonesia”, maka search engine akan mencari seluruh dokumen yang mengandung kata suku atau Indonesia, atau yang mengandung kedua kata tersebut. Di dalam satu event pencarian,

kata OR dapat dipergunakan beberapa kali, misalnya “raja OR presiden OR pemimpin OR dinasti” yang akan menampilkan

daftar dokumen yang memiliki satu atau lebih kata raja, presiden, pemimpin, atau dinasti (termasuk kombinasi antara 2-4 kata-kata tersebut).

Simbol berikutnya yang memiliki fungsi kurang lebih sama dengan tanda plus pada simbol matematika adalah AND, yang

dapat diterjemahkan sebagai kata “dan” dalam bahasa Indonesia. Contoh penggunaan simbol ini adalah sebagai berikut: “ilmu AND pengetahuan AND alam”. Search engine yang menerima masukan

seperti itu akan mencari seluruh dokumen di internet yang memuat tiga buah kata, yaitu ilmu, pengetahuan, dan alam di dalamnya. Jika di dalam model simbol matematika terdapat tanda minus (untuk merepresentasikan kecuali), maka dalam model simbol boolean terdapat kata NOT untuk merepresentasikan hal yang serupa.

Sebuah perintah dalam metode simbol boolean yang tidak diketemukan padanannya dalam simbol matematika adalah NEAR. Fungsi perintah ini cukup unik. Untuk mendapatkan

gambaran mengenai fungsi simbol ini, perhatikan contoh “siswa NEAR Bandung”. Perintah tersebut akan menginstruksikan search engine untuk mencari dokumen yang mengandung kata siswa dan Bandung, di mana jarak (jumlah kata di antara kedua kata tersebut) berdekatan. Dengan kata lain, search engine akan mencari

dokumen yang memuat kalimat seperti “siswa di Bandung terjaring polisi saat mengikuti konvoi geng motor” atau “Siswa di Bandung mendapat juara olimpiade matematika tingkat nasional”. pada

kalimat-kalimat tersebut relatif berdekatan. Kriteria berdekatan untuk masing-masing search engine biasanya berbeda.

Tanda () digunakan untuk menentukan pencarian yang fokus saja,

yang lainnya tidak dimunculkan. Tanda “ (kutip) digunakan untuk

membentuk suatu arti tertentu, misalnya kata pencarian “Carbon Dioksida” maka mesin pencari akan mencari dan menampilkan dokumen yang berisi frase “Carbon Dioksida”.

b) Google (www.google.com)

Sekitar tahun 2001, mesin pencari Google berkembang lebih besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari link popularity dan pagerank. Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti lebih banyak terkoneksi daripada yang lain. rangking situs (the pagerank) dari sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan masukan bagi rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang ditemukannya. Sistem tersebut dikembangkan oleh pendiri Google, Larry Page dan Sergey Brin di Universitas Stanford. Dengan adanya kelebihan tersebut, user interface Google sangat disukai oleh pengguna dan hal ini berkembang ke para pesaingnya.

Google merupakan mesin pencari yang paling banyak digunakan. Google mempunyai database yang besar. Google membagi database dengan mesin pencari lain, yaitu Yahoo artinya jika kata yang kita cari tidak ada di database Google, maka pencarian akan diteruskan ke Yahoo. Google juga dilengkapi dengan bahasa Indonesia. Google memberikan hasil pencarian yang cepat dan relevan, serta mempunyai sistem yang dapat mengatur hasil pencarian dari sekian banyak informasi yang ditemukan di internet. Google memungkinkan kita mencari lebih dari 1 juta alamat URL di internet.

Google menyimpan banyak halaman web di cache (halaman tersimpan) yang dimilikinya sehingga apabila kita gagal meng- hubungi server halaman web yang bersangkutan, kita dapat menampilkan halaman web yang terdapat di cache Google. Namun google juga memiliki kelemahan, yaitu informasi di halaman web yang disimpan di cache Google seringkali tidak up to date.

c) Lycos (www.lycos.com)

Lycos dibuat pada tahun 1994 di Carnegie Mellon University. Lycos merupakan mesin pencari tertua. Lycos mempunyai kelebihan, yaitu mudah digunakan dan mudah menemukan website yang terdapat di tripod.com.

d) Yahoo (www.yahoo.com)

Yahoo merupakan mesin pencari yang menggunakan indeks directory. Directory merupakan daftar link yang disusun menurut kelompok tertentu (misalnya pendidikan, kesehatan) dan dapat juga digunakan sebagai titik awal untuk menuju ke informasi tertentu.

Yahoo berawal dari koleksi link pribadi Jerry Yang. Kelebihan Yahoo adalah mempunyai database yang besar dan membagi database dengan Google.

3) Cara kerja mesin pencari

Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web yang diambil langsung dari WWW. Halaman- halaman ini diambil dengan web crawler, browser web otomatis yang mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya, kata-kata diambil dari judul, subjudul, atau ield khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.

Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya. Hasil pencarian biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya.

Search engine merupakan sebuah sistem database yang telah dirancang untuk mengindeks alamat-alamat internet (URL, FTP, usenet, dan lain-lain). Untuk melaksanakan tugasnya ini, search engine memiliki program khusus yang biasanya disebut spider, bot, atau crawler. Pada saat user mendaftarkan sebuah alamat web (URL), spider dari search engine akan menerima dan menganalisis URL tersebut. Dengan proses dan prosedur yang serba otomatis, spider ini akan memutuskan apakah web yang didaftarkan layak diterima atau tidak. Jika layak, spider akan menambahkan alamat URL tersebut ke sistem database mereka. Rangking-pun segera ditetapkan dengan algoritma dan caranya masing-masing. Jika tidak layak, terpaksa user harus bersabar dan mengulangi pendaftaran dengan periode tertentu. Jadi, semua yang namanya search engine pasti memiliki program yang disebut Spider. Program inilah yang sebenarnya menentukan apakah website user bisa diterima atau tidak.

Program spider berbeda dengan directory yang mengindeks halaman web secara manual. Manual yang dimaksud adalah mereka meng- gunakan orang biasa untuk menganalisis setiap halaman web yang masuk, tidak menggunakan spider atau crawler seperti halnya search engine. Keunggulan directory dibanding search engine adalah memberikan hasil pencarian yang lebih relevan dengan kualitas yang relatif lebih baik. Namun karena semua proses dilakukan secara manual menggunakan editor manusia, jumlah database yang dimiliki biasanya jauh lebih kecil dibandingkan dengan search engine. Itulah sebabnya sekarang ini banyak perusahaan yang mengelola directory menerapkan

sistem ganda, yaitu menggunakan directory + search engine. Contoh nyata adalah Yahoo yang menggandeng Google sebagai search engine default-nya. Contoh beberapa directory terkenal selain Yahoo adalah Open Directory Project, Looksmart, dan NBCi.