Mesin pencari: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
Cobatoprank (bicara | kontrib) Tag: kemungkinan spam pranala VisualEditor |
Tag: Suntingan perangkat seluler Suntingan peramban seluler Suntingan seluler lanjutan |
||
(37 revisi perantara oleh 22 pengguna tidak ditampilkan) | |||
Baris 1:
{{rapikan}}
{{riset asli}}
[[Berkas:WorldWideWebAroundGoogle.png|jmpl|350px|Mesin pencari]]
'''Mesin pencari web''' atau '''mesin telusur web''' ({{lang-en|web search engine}}) adalah [[program komputer]] yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan [[http|www]], [[ftp]], [[milis|publikasi milis]], ataupun [[nntp|''news group'']] dalam sebuah ataupun sejumlah komputer [[peladen]] dalam suatu [[jaringan komputer|jaringan]]. Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia.
Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang sering kali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai ''hits''. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman [[situs web]], gambar, ataupun Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritme kepemilikan dan [[basis data]] tertutup, diantaranya yang paling populer adalah safari [[Google]] ([[Bing#MSN Search|MSN Search]] dan [[Yahoo!]]). Telah ada beberapa upaya menciptakan mesin pencari dengan [[sumber terbuka]] (''open source''), contohnya adalah [[Htdig]], [[Nutch]], [[Egothor]] dan [[OpenFTS]].<ref>{{en}}[http://www.searchtools.com/tools/tools-opensource.html Open Source Search Engines]</ref>
Baris 229 ⟶ 233:
|}
Saat awal perkembangan internet, [[Tim Berners-Lee]] membuat sebuah situs web yang berisikan daftar situs web yang ada di internet melalui peladen web [[CERN]]. Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini.<ref>[http://www.w3.org/History/19921103-hypertext/hypertext/DataSources/WWW/Servers.html World-Wide Web Servers<!-- Bot generated title -->]</ref> Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian di [[internet]] adalah ''Archie'' yang berasal dari kata "''archive''" tanpa menggunakan huruf "''v''".<ref name="LeidenUnivSE">"Internet History - Search Engines" (from [[Search Engine Watch]]),
Universiteit Leiden, Netherlands, September 2001, web:
[http://www.internethistory.leidenuniv.nl/index.php3?c=7 LeidenU-Archie] {{Webarchive|url=https://web.archive.org/web/20090413030108/http://www.internethistory.leidenuniv.nl/index.php3?c=7
Mesin pencari lainnya seperti [[Aliweb]], muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar adalah [[Lycos]], yang dimulai di [[Carnegie Mellon University]] sebagai proyek riset pada tahun [[1994]].
Baris 264 ⟶ 268:
== Cara kerja mesin pencari ==
[[Mesin pencari web]] bekerja dengan cara menyimpan informasi tentang banyak [[halamanweb|halaman web]], yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan [[web crawler]] — ''browser'' web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau ''field'' khusus yang disebut [[meta tag]]). Data tentang halaman web disimpan dalam sebuah indeks basis data untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti [[Google]], menyimpan seluruh atau sebagian [[halaman sumber]] (yang disebut [[cache]]) maupun informasi tentang halaman web itu sendiri.
Selain [[halaman web]], Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada [[file]], seperti [[file audio]], [[file video]], gambar, [[foto]] dan sebagainya, serta [[informasi]] tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin terus berkembang sesuai dengan perkembangan [[teknologi informasi]].
Baris 275 ⟶ 279:
Sebagian besar mesin pencari web adalah usaha komersial yang didukung pemasukan [[iklan]] dan karenanya sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil pencarian.
== Pencarian ==
Baris 297 ⟶ 294:
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki. Database tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
Alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk ''hypertext link'' dengan URL menuju halaman lainnya.
Tidak mungkin seseorang melakukan pencarian ke seluruh komputer yang terhubung ke internet, atau bahkan alat bantu pencarian yang mengklaim bahwa melakukannya, tidak benar.
Baris 337 ⟶ 334:
</ol>
== Prinsip
Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitektur dan mekanismenya.
=== Spider ===
Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser.
=== Crawler ===
Baris 381 ⟶ 378:
== Mesin pencari populer ==
Berikut ini adalah beberapa mesin pencari populer hingga saat ini:
# [[Google
# [[Microsoft
# [[Yahoo]]
# [[Open Directory]]
# [[Bing]]
# [[Altavista
# [[AOL]]
# [[Baidu
== Lihat pula ==
Baris 427 ⟶ 423:
== Bacaan lanjutan ==
*
* {{cite journal | quotes = | author = Steve Lawrence; C. Lee Giles | date = | year = 1999| title = Accessibility of information on the web | journal = [[Nature (journal)|Nature]] | volume = 400 | issue = 6740| page = 107 | doi = 10.1038/21987 | pmid = 10428673 | pages = 107–9 | issn = 0028-0836 }}
* Bing Liu (2007), ''[http://www.cs.uic.edu/~liub/WebMiningBook.html Web Data Mining: Exploring Hyperlinks, Contents and Usage Data].'' Springer, ISBN 3-540-37881-2
* Bar-Ilan, J. (2004). The use of Web search engines in information science research. ARIST, 38, 231-288.
|