Mesin pencari: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Satublogs (bicara | kontrib)
0xrypto (bicara | kontrib)
kTidak ada ringkasan suntingan
 
(283 revisi antara oleh lebih dari 100 100 pengguna tak ditampilkan)
Baris 1:
{{rapikan}}
[[Berkas:WorldWideWebAroundGoogle.png|thumb|350px|Mesin pencari]]
{{riset asli}}
'''Mesin pencari''' adalah [[program komputer]] yang dirancang untuk membantu seseorang menemukan file-file yang disimpan dalam [[komputer]], misalnya dalam sebuah ''server'' umum di [[World Wide Web|web]] (WWW) atau dalam komputer sendiri. Mesin pencari memungkinkan kita untuk meminta ''content'' media dengan kriteria yang spesifik (biasanya yang berisi kata atau frasa yang kita tentukan) dan memperoleh daftar file yang memenuhi kriteria tersebut. Mesin pencari biasanya menggunakan indeks (yang sudah dibuat sebelumnya dan dimutakhirkan secara teratur) untuk mencari file setelah pengguna memasukkan [[kriteria pencarian]].
[[Berkas:WorldWideWebAroundGoogle.png|jmpl|350px|Mesin pencari]]
 
'''Mesin pencari web''' atau '''mesin telusur web''' ({{lang-en|web search engine}}) adalah [[program komputer]] yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan [[http|www]], [[ftp]], [[milis|publikasi milis]], ataupun [[nntp|''news group'']] dalam sebuah ataupun sejumlah komputer [[peladen]] dalam suatu [[jaringan komputer|jaringan]]. Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia.
Dalam konteks [[Internet]], mesin pencari biasanya merujuk kepada WWW dan bukan protokol ataupun area lainnya. Selain itu, mesin pencari mengumpulkan data yang tersedia di ''newsgroup'', database besar, atau direktori terbuka seperti DMOZ.org. Karena [[pengumpulan data]]nya dilakukan secara otomatis, mesin pencari berbeda dengan [[direktori Web]] yang dikerjakan manusia.
 
Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang sering kali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai ''hits''. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman [[situs web]], gambar, ataupun berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu [[basis data]] ataupun [[direktori web]].
Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan dan database tertutup - yang paling populer adalah [[Google]] ([[MSN Search]] dan [[Yahoo!]] tertinggal sedikit di belakang). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber-terbuka (''[[open-source]]''), contohnya adalah [[Htdig]], [[Nutch]], [[Egothor]] dan [[OpenFTS]]. [http://www.searchtools.com/tools/tools-opensource.html]
Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritme kepemilikan dan [[basis data]] tertutup, diantaranya yang paling populer adalah safari [[Google]] ([[Bing#MSN Search|MSN Search]] dan [[Yahoo!]]). Telah ada beberapa upaya menciptakan mesin pencari dengan [[sumber terbuka]] (''open source''), contohnya adalah [[Htdig]], [[Nutch]], [[Egothor]] dan [[OpenFTS]].<ref>{{en}}[http://www.searchtools.com/tools/tools-opensource.html Open Source Search Engines]</ref>
 
== Sejarah ==
{|class="bordered infobox"
|-
! colspan = "3" | Garis waktu ([[Daftar mesin pencari|daftar lengkap]]) <!--Note: "Launch" refers only to web availability of original crawl-based web search engine results.-->
|-
!|Tahun
!|Mesin
!|Status
|-
| rowspan="2" |1993
||[[W3Catalog]]
|{{Site inactive}}
|-
||[[Aliweb]]
|{{Site inactive}}
|-
| rowspan="3" |1994
||[[WebCrawler]]
|{{Site active}},<br/>Aggregator
|-
||[[Go.com]]
|{{Site active}},<br/>Yahoo Search
|-
||[[Lycos]]
|{{Site active}}
|-
| rowspan="6" |1995
||[[AltaVista]]
|{{Site inactive}}<br/>(URL dialihkan ke Yahoo!)
|-
|[[Daum Communications|Daum]]
|{{Site active}}
|-
||[[Magellan (mesin pencari)|Magellan]]
|{{Site inactive}}
|-
||[[Excite]]
|{{Site active}}
|-
||[[SAPO (perusahaan)|SAPO]]
|{{Site active}}
|-
||[[Yahoo!]]
|{{Site active}},<br/>Diluncurkan sebagai direktori
|-
| rowspan="4" |1996
||[[Dogpile]]
|{{Site active}},<br/>Agregator
|-
||[[Inktomi (perusahaan)|Inktomi]]
||Diakuisisi Yahoo!
|-
||[[HotBot]]
|{{Site active}}<br/>(lycos.com)
|-
||[[Ask.com|Ask Jeeves]]
|{{Site active}}<br/>(berubah nama menjadi ask.com)
|-
| rowspan="2" |1997
||[[Northern Light Group|Northern Light]]
|{{Site inactive}}
|-
||[[Yandex]]
|{{Site active}}
|-
| rowspan="2" |1998
||[[Google Search|Google]]
|{{Site active}}
|-
||[[MSN Search]]
|{{Site active}}<br/>dengan nama Bing
|-
|rowspan="5"|1999
||[[AlltheWeb]]
|{{Site inactive}}<br/>(URL dialihkan ke Yahoo!)
|-
||[[GenieKnows]]
|{{Site active}},<br/>berubah nama menjadi Yellowee.com
|-
||[[Naver]]
|{{Site active}}
|-
||[[Teoma]]
|{{Site active}}
|-
||[[Vivisimo]]
|{{Site inactive}}
|-
|rowspan="2"|2000
||[[Baidu]]
|{{Site active}}
|-
||[[Exalead]]
||Diakuisisi [[Dassault Systèmes]]
|-
||2002
||[[Inktomi (perusahaan)|Inktomi]]
||Diakuisisi Yahoo!
|-
||2003
||[[Info.com]]
|{{Site active}}
|-
| rowspan="3" |2004
||[[Yahoo! Search]]
|{{Site active}},<br/>Meluncurkan pencarian web sendiri<br/>(lihat Yahoo! Directory, 1995)
|-
||[[A9.com]]
|{{Site inactive}}
|-
||[[Sogou.com|Sogou]]
|{{Site active}}
|-
| rowspan="4" |2005
||[[AOL Search]]
|{{Site active}}
|-
||[[Ask.com]]
|{{Site active}}
|-
||[[GoodSearch]]
|{{Site active}}
|-
||[[SearchMe]]
|| Ditutup
|-
| rowspan= "6" |2006
||[[wikiseek]]
|{{Site inactive}}
|-
||[[Quaero]]
|{{Site active}}
|-
||[[Ask.com]]
|{{Site active}}
|-
||[[Live Search]]
|{{Site active}} dengan nama Bing<br/>Berganti nama menjadi MSN Search
|-
||[[ChaCha (mesin pencari)|ChaCha]]
|{{Site active}}
|-
||[[Guruji.com]]
|{{Site active}}
|-
| rowspan= "4" |2007
||[[wikiseek]]
|{{Site inactive}}
|-
||[[Sproose]]
|{{Site inactive}}
|-
||[[Wikia Search]]
|{{Site inactive}}
|-
||[[Blackle.com]]
|{{Site active}}
|-
| rowspan= "8" |2008
||[[Powerset (perusahaan)|Powerset]]
|{{Site inactive}}<br/>(dialihkan ke Bing)
|-
||[[Picollator]]
|{{Site inactive}}
|-
||[[Viewzi]]
|{{Site inactive}}
|-
||[[Boogami]]
|{{Site inactive}}
|-
||[[LeapFish]]
|{{Site inactive}}
|-
||[[Forestle]]
|{{Site inactive}}<br/>(dialihkan ke Ecosia)
|-
||[[VADLO]]
|{{Site active}}
|-
||[[DuckDuckGo]]
|{{Site active}}, Aggregator
|-
| rowspan= "4" |2009
||[[Bing]]
|{{Site active}},<br/>Sebelumnya Live Search
|-
||[[Yebol]]
|{{Site active}}
|-
||[[Mugurdy]]
|{{Site inactive}}<br/>karena tidak ada dana
|-
||[[Goby Inc.|Goby]]
|{{Site active}}
|-
|rowspan= "4" |2010
||[[Blekko]]
|{{Site active}}
|-
||[[Cuil]]
|{{Site inactive}}
|-
||[[Yandex]]
|{{Site active}},<br/>Pencarian global
|-
||[[Yummly]]
|{{Site active}}
|-
| rowspan="2" |2011
||[[Mesin pencari pendidikan Interred|Interred]]
|{{Site active}}
|-
||[[Yandex]]
|{{Site active}},<br/>Pencarian Turki
|-
||2012
||[[Volunia]]
|{{Site active}}
|-
||2013
||[[Aoohe]]
|{{Site active}}
|-
||2023
||[[Plipeo]]
|{{Site active}}
|}
 
Saat awal perkembangan internet, [[Tim Berners-Lee]] membuat sebuah situs web yang berisikan daftar situs web yang ada di internet melalui peladen web [[CERN]]. Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini.<ref>[http://www.w3.org/History/19921103-hypertext/hypertext/DataSources/WWW/Servers.html World-Wide Web Servers<!-- Bot generated title -->]</ref> Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian di [[internet]] adalah ''Archie'' yang berasal dari kata "''archive''" tanpa menggunakan huruf "''v''".<ref name="LeidenUnivSE">"Internet History - Search Engines" (from [[Search Engine Watch]]),
Universiteit Leiden, Netherlands, September 2001, web:
[http://www.internethistory.leidenuniv.nl/index.php3?c=7 LeidenU-Archie] {{Webarchive|url=https://web.archive.org/web/20090413030108/http://www.internethistory.leidenuniv.nl/index.php3?c=7|date=2009-04-13}}.</ref> Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter Deutsch, saat itu adalah mahasiswa [[ilmu komputer]] [[Universitas McGill]], [[Amerika Serikat]]. Cara kerja program tersebut adalah mengunduh daftar direktori serta berkas yang terdapat pada layanan [[ftp]] publik (anonim) kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.
 
Mesin pencari lainnya seperti [[Aliweb]], muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar adalah [[Lycos]], yang dimulai di [[Carnegie Mellon University]] sebagai proyek riset pada tahun [[1994]].
 
Segera setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan popularitas. Termasuk di antaranya adalah safari web browsing yang aman dan untuk publik. Masing-masing bersaing dengan menambahkan layakan-layanan tambahan seperti yang dilakukan oleh [[Yahoo]].
 
Tahun 2002 Yahoo! mengakuisisi [[Inktomi]], setahun kemudian mengakuisisi [[AlltheWeb]] dan [[Altavista]] kemudian meluncurkan mesin pencari sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin pencari yang telah diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web daripada layanan-layanan lainnya.
 
Di bulan desember 2003, [[Orase]] menerbitkan versi pertama dari teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja yang jauh lebih baik.
 
Mesin pencari juga dikenal sebagai target investasi [[internet]] yang terjadi pada akhir tahun [[1990]]-an. Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan mesin pencari, dan hanya memasarkannya pada edisi-edisi ''enterprise'' saja, contoh [http://www.northernlight.com/ Northern Light] sebelumnya diketahui merupakan salah satu perintis layanan mesin pencari di internet.
 
Buku Osmar R. Zaïane ''[[From Resource Discovery to Knowledge Discovery on the Internet]]'' menjelaskan secara rinci sejarah [[teknologi mesin pencari]] sebelum munculnya Google. Mesin-mesin pencari lainnya mencakup [[a9.com]], [[AlltheWeb]], [[Ask Jeeves]], [[Clusty]], [[Gigablast]], [[Teoma]], [[Wisenut]], [[GoHook]], [[Kartoo]], dan [[Vivisimo]].
 
=== Google ===
Google muncul pada akhir tahun 1997, di mana Google memasuki pasar yang telah diisi oleh para pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo, Altavista, HotBot, Excite, InfoSeek dan Lycos, di mana perusahaan-perusahaan tersebut mengklaim sebagai perusahaan yang bergerak dalam bidang layanan pencarian di internet. Hingga akhirnya Google mampu menjadi sebagai penyedia mesin pencari yang cukup diperhitungkan di dunia.
 
Saat tingginya persaingan antar mesin pencari yang ada, namun mesin pencari lain tidak mampu menghentikan kesuksesan Google. Setelah Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google mampu menerobos liga besar tersebut. sehingga Google dipandang sebagai mesin pencari yang utama seperti yang kita ketahui pada hari ini.
 
=== Yahoo! ===
Yahoo! raja direktori di [[internet]], di samping para pengguna [[internet]] melihat DMOZ serta LookSmart berusaha menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh secara cepat dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah untuk memasukinya, dengan demikian, mendapatkan sebuah daftar pada direktori Yahoo memang memiliki nilai yang tinggi.
 
pada tahun 2001, mesin pencari [[Google]] berkembang besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari [[link popularity]] dan [[PageRank]]. Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah ''premis'' bahwa situs yang diinginkan pasti lebih banyak terhubung daripada yang lain. Rangking situs (The PageRank) dari sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang ditemukannya. ''User interface'' Google sangat disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.
 
== Manfaat ==
* Mesin pencari merupakan tempat kebanyakan orang mencari sesuatu via internet. Menurut survei hampir 90% pengguna internet memakai mesin pencari untuk mencari lokasi tertentu di internet. Dan di antara mesin pencari yang ada, Google merupakan mesin pencari yang paling banyak digunakan.
* Sebagian besar pengguna mesin pencari tidak pernah melewatkan dua halaman pertama dari mesin pencari.
* Sebagian besar (hampir 70%) pengguna mesin pencari tidak pernah klik pada hasil pencarian sponsor. Dengan demikian, hasil pencarian yang organik (secara alami) akan membuat suatu [[World Wide Web|website]] memperoleh posisi strategis dalam dunia [[internet]].
* Di negara-negara maju, porsi penjualan yang dilakukan melalui [[internet]] sudah hampir mencapai 20% dari keseluruhan transaksi tahunan.
* Sebuah informasi yang mudah diakses oleh semua orang baik dalam maupun luar negeri.
* Memudahkan masyarakat dalam mencari informasi di internet
 
== Cara kerja mesin pencari ==
[[Mesin pencari web]] bekerja dengan cara menyimpan informasi tentang banyak [[halamanweb|halaman web]], yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan [[web crawler]] — ''browser'' web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnyaindeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau ''field'' khusus yang disebut [[meta tag]]). Data tentang halaman web disimpan dalam sebuah database indeks basis data untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti [[Google]], menyimpan seluruh atau sebagian [[halaman sumber]] (yang disebut [[cache]]) maupun informasi tentang halaman web itu sendiri.
 
Selain [[halaman web]], Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada [[file]], seperti [[file audio]], [[file video]], gambar, [[foto]] dan sebagainya, serta [[informasi]] tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin terus berkembang sesuai dengan perkembangan [[teknologi informasi]] <ref>http://www.satublogs.com/web-design/apa-yang-dimaksud-dengan-seo-friendly.html#se1</ref>.
 
Ketika seorang penggunaseseorang mengunjungi mesin pencari dan memasukkan ''[[query]]'', biasanya dengan memasukkan [[kata kunci]], mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian teksnya.
 
Ada jenis mesin pencari lain: mesin pencari ''real-time'', seperti [http://www.orase.com Orase]. Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem ''real-time'' ini unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit sumberdayasumber daya sistem yang diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian lebih lama rampungnya.
 
[[Manfaat]] mesin pencari bergantung pada [[relevansi]] hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frasefrasa, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan [[peringkat]] hasil pencarian agar mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metodenyametode nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
 
Sebagian besar mesin pencari web adalah usaha komersial yang didukung pemasukan [[iklan]] dan karenanya sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil pencarian.
 
== Pencarian ==
<!-- Trivial
=== Proses Pencarian ===
== Beberapa Tips Mencari dengan Menggunakan Mesin Pencari ==
Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengingat begitu menyebarnya informasi di mana-mana, bahkan University of California menyebutkan saat ini telah terdapat lebih dari 50 miliar halaman web di [[internet]], meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
 
Kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi isinya. Tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga tidak sedikit.
filetype:
 
Dalam pencarian di [[World Wide Web|web]], pengguna selalu memperkirakan kata apa yang kira-kira terdapat pada halaman yang ingin di temukan. Atau kira-kira apa subjek yang dipilih oleh seseorang untuk mengelola halaman situs yang mereka kelola, topik apa saja kira-kira yang di bahas.
Option ini digunakan untuk mencari tipe file tertentu.
Contoh:
filetype:xls -> untuk mencari file MS Excel
filetype:doc -> untuk mencari file MS Word
 
Jika pengguna melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan pencarian. Tidak mungkin melakukan pencarian di [[WWW]] secara langsung.
inurl:
 
Pada [[World Wide Web|web]] benar-benar terdiri dari banyak sekali halaman web yang disimpan dari berbagai server diseluruh dunia. [[Komputer]] pengguna tidak langsung melakukan pencarian kepada seluruh komputer tersebut secara langsung.
Option ini digunakan untuk mencari kata tertentu yang "masuk" sebagai url.
Dengan option ini Anda dapat melakukan pencarian pada pencarian folder tertentu (jika dikombinasikan dengan option "index of").
Contoh:
inurl:admin -> pencarian ini menghasilkan url website yang mempunyai kata "admin"
 
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki. Database tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
site:
 
Alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk ''hypertext link'' dengan URL menuju halaman lainnya. Saat diklik, dan menuju ke alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada ''server'' tersebut disediakan, sesuai dengan informasi yang terdapat di dalamnya. Layanan ini bisa menjangkau ke manapun di seluruh dunia.
Option ini secara spesifik digunakan untuk melakukan pencarian pada situs tertentu.
Contoh:
site:torry.net "xp style" -> mencari dengan keyword "xp style" pada situs www.torry.net
 
Tidak mungkin seseorang melakukan pencarian ke seluruh komputer yang terhubung ke internet, atau bahkan alat bantu pencarian yang mengklaim bahwa melakukannya, tidak benar.
intitle:
 
=== Kategori Alat Pencari ===
Option ini digunakan untuk mencari kata tertentu yang terdapat pada title dari halaman web.
Saat ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan strategi yang berbeda untuk memanfaatkan kemampuan potensial dari masing-masing nya, yaitu
[http://www.annebebekgelisimi kata tertentu ]
link:
 
=== Mesin Pencari dan Mesin Pencari-meta ===
Option ini digunakan untuk mengetahui situs mana saja yang nge-link ke situs tertentu.
Contoh:
link:delphi3000.com -> mencari situs yang mempunyai link ke www.delphi3000.com
 
Karakteristik:
Anda dapat mengkombinasikan berbagai option di atas untuk mendapatkan hasil pencarian yang lebih spesifik.
<ol style="list-style-type: lower-alpha;">
Contoh:
<li> Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,
pdf "rapidshare.de/files" site:rapidshare.de
<li> Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada dalam dokumen,
-> untuk mencari buku atau file pdf di rapidshare.de
<li> Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,
<li> Database dijaring dan dikumpulkan oleh spider, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin dari pandangan atau sentuhan manusia,
<li> Ukuran mesin pencari: dari skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20 miliar halaman web).
<li> Mesin pencari meta: dengan cepat melakukan pencarian ke dalam beberapa data base dari berbagai mesin pencari dalam satu kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil pencarian dari beberapa mesin pencari yang mereka libatkan.
Contoh: Mesin pencari: [[Google]], [[Yahoo Search]], Ask.com. Mesin pencari meta: Dogpile, Copernic, dan lainnya.
</ol>
 
=== Subject Directories ===
+inurl:exe|rar|zip site:rapidshare.de
<ol style="list-style-type: lower-alpha;">
-> untuk mencari program, aplikasi di rapidshare.de
Karakteristik:
<li> Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala para ahli untuk subjek tertentu,
<li> Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat general,
<li> Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun secara [[hierarki]],
<li> Sering dilengkapi dengan catatan mengenai deskripsinya ( tidak untuk Yahoo),
<li> Subjek dapat di-''browse'' subjek dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
<li> Dokumen yang tidak penuh teks. Pencarian diminta lebih spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori-kategori, dan deskripsi.
<li> Terdapat ribuan atau bahkan lebih subjek direktori dalam praktik dan kenyataannya apa saja yang dipikirkan di sana.
</ol>
 
=== Specialized Database (Invisible Web) ===
Anda dapat mengganti site:rapidshare.de menjadi site:megaupload.com untuk mencari file di MegaUpload
Karakteristik:
-->
<ol style="list-style-type: lower-alpha;">
<li> Merupakan [[World Wide Web|web]] yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database pada sebuah komputer di suatu tempat,
<li> Dapat saja berubah berbagai topik, dapat pula juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll
<li> Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online.
</ol>
 
== SejarahPrinsip umum ==
Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitektur dan mekanismenya.
Mesin pencari pertama adalah "Wandex", yang sekarang index yang tidak berfungsi dari [[World Wide Web Wanderer]], suatu [[web crawler]] dibangun oleh Matthew Gray di [[Massachusetts Institute of Technology|MIT]] pada [[1993]]. Mesin pencari lain yang lama, [[Aliweb]], juga muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar adalah [[Lycos]], yang dimulai di [[Carnegie Mellon University]] sebagai proyek riset di tahun [[1994]].
 
=== Spider ===
Segera sesudah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan popularitas. Termasuk di antaranya adalah [[WebCrawler]], [[Hotbot]], [[Excite]], [[Infoseek]], [[Inktomi]], dan [[AltaVista]]. Mereka bersaing dengan direktori-direktori populer seperti misalnya [[Yahoo]]. Belakangan direktori-direktori ini menggabungkan atau menambahkan [[teknologi mesin pencari]] agar fungsinya semakin meningkat.
Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser. Perbedaannya adalah bahwa browser menampilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.
 
=== Crawler ===
Pada tahun 2002, Yahoo! mengakuisisi [[Inktomi]] dan pada 2003, mengakuisisi Overture yang memiliki [[AlltheWeb]] dan [[Altavista]]. Tahun 2004, Yahoo! meluncurkan mesin pencarinya sndiri yang didasarkan pada teknologi gabungan dari mesin-mesin yang telah diakuisisinya dan memberikan pelayanan yang mengutamakan mesin pencari Web daripada direktorinya.
Merupakan program yang dimiliki mesin pencari untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spider harus pergi ke mana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh mesin pencari.
 
=== Indexer ===
Pada Desember 2003, [[Orase]] menerbitkan versi pertama dari teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan performancenya meningkat sangat hebat.
Komponen ini melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag [[HTML]] khusus, dll.
 
=== Database ===
Mesin pencari juga dikenal sebagai bintang-bintang yang paling cemerlang dalam perlombaan investasi Internet yang terjadi pada akhir tahun [[1990]]-an. Beberapa perusahaan masuk ke dalam pasar dengan hebat, mencatat keuntungan besar pada penawaran publik pertamanya. Sebagian lagi sama sekali menyingkirkan mesin pencari publiknya, dan hanya memasarkan edisi-edisi Enterprise saja, seperti misalnya [http://www.northernlight.com/ Northern Light] yang dulunya adalah salah satu dari 8 atau 9 mesin pencari awal setelah Lycos muncul.
Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. Kadang kala disebut juga dengan indeks dari suatu mesin pencari.
 
=== Result Engine ===
Sebelum munculnya Web, ada pula mesin-mesin pencari untuk [protokol]] atau penggunaan lain, seperti misalnya [[Archie search engine]] untuk situs-situs [[FTP anonim]] dan [[Veronica (computer)|Veronica search engine]] untuk [[Gopher protocol]].
Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada mesin pencari. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk penampilan yang akan ditampilkan.
 
Proses ini dilaksanakan berdasarkan [[algoritme]] perangkingan yang dimiliki oleh mesin pencari tersebut, mengikuti kaidah perangkingan halaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh mesin pencari tersebut.
Buku Osmar R. Zaïane ''[[From Resource Discovery to Knowledge Discovery on the Internet]]'' menjelaskan secara rinci sejarah [[teknologi mesin pencari]] sebelum munculnya Google.
 
=== Web Server ===
Mesin-mesin pencari lainnya mencakup [[a9.com]], [[AlltheWeb]], [[Ask Jeeves]], [[Clusty]], [[Gigablast]], [[Teoma]], [[Wisenut]], [[GoHook]], [[Kartoo]], dan [[Vivisimo]].
Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini biasanya menghasilkan [[informasi]] atau dokumen dalam format [[HTML]]. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta informasi.
 
=== GooglePangsa pasar ===
{{expand section|Informasi tentang mesin pencari nasional seperti [[StatCounter]], [[Yandex]], [[Naver]] dan pangsa pasar di negara bersangkutan.|date=Oktober 2011}}
Sekitar tahun 2001, mesin pencari [[Google]] berkembang lebih besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari [[link popularity]] dan [[PageRank]]. Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti lebih banyak terkoneksi daripada yang lain. Rangking situs (The PageRank)dari sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang ditemukannya. User interface Google sangat disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.
{| class="wikitable sortable"
! Mesin pencari !! colspan="2"|Pangsa pasar Mei 2011 !! colspan="2"|Pangsa pasar Desember 2010<ref>{{cite web|url=http://marketshare.hitslink.com/search-engine-market-share.aspx?qprid=4 |title=Net Marketshare - World |publisher=Marketshare.hitslink.com |date= |accessdate=2012-05-14}}</ref>
|-
| [[Google Search|Google]] || style="text-align:right;"|{{bartable|82,80|%|2}} || style="text-align:right;"|{{bartable|84,65|%|2}}
|-
| [[Yahoo!]] || style="text-align:right;"|{{bartable| 6,42|%|2}} || style="text-align:right;"|{{bartable| 6,69|%|2}}
|-
| [[Baidu]] || style="text-align:right;"|{{bartable| 4,89|%|2}} || style="text-align:right;"|{{bartable| 3,39|%|2}}
|-
| [[Bing]] || style="text-align:right;"|{{bartable| 3,91|%|2}} || style="text-align:right;"|{{bartable| 3,29|%|2}}
|-
| [[Yandex]] || style="text-align:right;"|{{bartable| 1,7|%|2}} || style="text-align:right;"|{{bartable| 1,3|%|2}}
|-
| [[Ask.com|Ask]] || style="text-align:right;"|{{bartable| 0,52|%|2}} || style="text-align:right;"|{{bartable| 0,56|%|2}}
|-
| [[AOL]] || style="text-align:right;"|{{bartable| 0,3|%|2}} || style="text-align:right;"|{{bartable| 0,42|%|2}}
|}
 
== Mesin pencari populer ==
<!-- Belum diterjemahkan
 
== Tantangan yang dihadapi mesin-mesin pencari ==
Berikut ini adalah beberapa mesin pencari populer hingga saat ini:
* The web is growing much faster than any present-technology search engine can possibly index (see [[distributed crawling]]).
# [[Google]]
* Many web pages are updated frequently, which forces the search engine to revisit them periodically.
# [[Microsoft]]
* The queries one can make are currently limited to [[searching for key words]], which may results in many false positives.
# [[Yahoo]]
* Dynamically generated sites, which may be slow or difficult to index, or may result in excessive results from a single site.
# [[Open Directory]]
* Many dynamically generated sites are not indexable by search engines; this phenomenon is known as the [[invisible web]].
# [[Bing]]
* Some search engines do not order the results by relevance, but rather according to how much money the sites have paid them.
# [[Altavista]]
* Some sites use tricks to manipulate the search engine to display them as the first result returned for some keywords. This can lead to some search results being polluted, with more relevant links being pushed down in the result list.
# [[AOL]]
-->
# [[Baidu]]
 
== Lihat pula ==
{{col|2}}
* [[Sejarah Internet]]
* [[Daftar mesin pencari]]
* [[Perbandingan mesin pencari web]]
* [[Data mining]]
* [[Penjawaban pertanyaan|Mesin penjawab]] (penjawaban pertanyaan) <!-- examples necessary here until article comprehensible to normal reader-->
** [[Quora]]
** [[True Knowledge]]
** [[Wolfram Alpha]]
* [[Arsitektur berorientasi pencarian]]
* [[Direktori pencarian]]
* [[Efek Google]]
* [[Indeksasi web]]
* [[Internet Search Engines and Libraries]]
* [[Kueri pencarian web]]
* [[Mesin metapencari]]
* [[Mesin pencari bahasa alami]]
* [[Mesin pencari kolaboratif]]
* [[OpenSearch]]
* [[Optimisasi mesin pencari]]
* [[Pemasaran mesin pencari]]
* [[Pemeriksa ejaan]]
* [[Pencarian berbasis pilihan]]
* [[Pencarian perusahaan]]
* [[Pencarian sosial]]
* [[Web Semantik]]
* [[Website Parse Template]]
{{colend}}
 
== Referensi ==
{{Reflist}}
* GBMW: Reports of 30-day punishment, re: Car maker BMW had its German website bmw.de delisted from Google, such as: [http://slashdot.org/article.pl?sid=06/02/05/235218 Slashdot-BMW] (05-Feb-2006).
* INSIZ: Maximum size of webpages indexed by MSN/Google/Yahoo! ("100-kb limit"): [http://www.sitepoint.com/article/indexing-limits-where-bots-stop Max Page-size] (28-Apr-2006).
 
== Bacaan lanjutan ==
* Untuk sejarah mesin pencari awal yang lebih rinci, lihat [http://searchenginewatch.com/showPage.html?page=3071951 Search Engine Birthdays] {{Webarchive|url=https://web.archive.org/web/20081002032127/http://searchenginewatch.com/showPage.html?page=3071951 |date=2008-10-02 }} (from [[Search Engine Watch]]), Chris Sherman, September 2003.
* {{cite journal | quotes = | author = Steve Lawrence; C. Lee Giles | date = | year = 1999| title = Accessibility of information on the web | journal = [[Nature (journal)|Nature]] | volume = 400 | issue = 6740| page = 107 | doi = 10.1038/21987 | pmid = 10428673 | pages = 107–9 | issn = 0028-0836 }}
* Bing Liu (2007), ''[http://www.cs.uic.edu/~liub/WebMiningBook.html Web Data Mining: Exploring Hyperlinks, Contents and Usage Data].'' Springer, ISBN 3-540-37881-2
* Bar-Ilan, J. (2004). The use of Web search engines in information science research. ARIST, 38, 231-288.
* {{cite book|first = Mark|last = Levene|year = 2005|title = An Introduction to Search Engines and Web Navigation|publisher = Pearson|location =|isbn = }}
* {{cite book|first = Randolph|last = Hock|year = 2007|title = The Extreme Searcher's Handbook}} ISBN 978-0-910965-76-7
* {{cite journal | quotes = | author = Javed Mostafa | date = | year = 2005 | month = February | title = Seeking Better Web Searches | journal = [[Scientific American Magazine]] | volume = | issue = | pages = | publisher = | pmid = | doi = | bibcode = | url = http://www.sciam.com/article.cfm?articleID=0006304A-37F4-11E8-B7F483414B7F0000 | language = }}{{dead link|date=September 2010}}
* {{cite journal |last=Ross |first=Nancy |authorlink= |coauthors=Wolfram, Dietmar |year=2000 |title=End user searching on the Internet: An analysis of term pair topics submitted to the Excite search engine |journal=Journal of the American Society for Information Science |volume=51 |issue=10 |pages=949–958 |doi= 10.1002/1097-4571(2000)51:10<949::AID-ASI70>3.0.CO;2-5|url= |accessdate=|quote= }}
* {{cite journal |last=Xie |first=M. |authorlink= |year=1998 |title=Quality dimensions of Internet search engines |journal=Journal of Information Science |volume=24 |issue=5 |pages=365–372 |doi=10.1177/016555159802400509 |url= |accessdate=|quote= |display-authors=1 |last2=Wang |first2=H. |last3=Goh |first3=T. N. }}
* {{cite book|title=Information Retrieval: Implementing and Evaluating Search Engines|url=http://www.ir.uwaterloo.ca/book/|year=2010|publisher=MIT Press|author8=Stefan Büttcher, Charles L. A. Clarke, and Gordon V. Cormack|access-date=2012-08-25|archive-date=2020-10-05|archive-url=https://web.archive.org/web/20201005195805/http://www.ir.uwaterloo.ca/book/|dead-url=yes}}
 
== Pranala luar ==
{{commons category|Internet search engines}}
<!-- Jangan menambah pranala luar ke mesin pencari -->
* {{en}} {{Dmoz|Computers/Internet/Searching/Search_Engines/|MesinSearch pencariEngines}}
* [https://jurnal.kdi.or.id/index.php/bt/article/view/237 Search Engine Optimization (SEO) As A Promotional Media On Google Search] di Jurnal Komunitas Dosen Indonesia
* {{en}} [http://www.searchenginehistory.com/ Sejarah mesin pencari]
* {{en}} [http://www.searchenginesindex.com/ Daftar mesin pencari]
* {{en}} [http://www.howstuffworks.com/search-engine.htm Penjelasan mesin pencari oleh "How Stuff Works"]
* {{id}} [http://directory.google.com/Top/World/Bahasa_Indonesia/Komputer/Internet/Pencarian/ Direktori Google untuk Mesin Pencari Indonesia]
<!-- Jangan menambah pranala luar ke mesin pencari -->
 
[[Kategori:Mesin pencari{{Pencarian Internet]]}}
 
{{DEFAULTSORT:Mesin Pencari Web}}
[[af:Soekenjin]]
[[Kategori:Pemerolehan informasi]]
[[ar:محرك بحث]]
[[Kategori:Mesin pencari internet]]
[[ast:Motor de gueta]]
[[Kategori:Istilah internet]]
[[be-x-old:Сеціўная пошукавая сыстэма]]
[[Kategori:Sejarah internet]]
[[bg:Търсачка]]
[[bs:Internet pretraživač]]
[[ca:Motor de cerca]]
[[cs:Internetový vyhledávač]]
[[cy:Peiriant chwilio rhyngrwyd]]
[[da:Søgemaskine]]
[[de:Suchmaschine]]
[[el:Μηχανή αναζήτησης]]
[[en:Web search engine]]
[[eo:Serĉilo]]
[[es:Motor de búsqueda]]
[[eu:Bilaketa motor]]
[[ext:Landeru]]
[[fa:جویشگر]]
[[fi:Hakukone]]
[[fiu-vro:Võrgostotsja]]
[[fr:Moteur de recherche]]
[[gl:Motor de busca]]
[[gu:વેબ શોધ એન્જીન]]
[[he:מנוע חיפוש]]
[[hi:खोज संयन्त्र]]
[[hr:Tražilica]]
[[hu:Keresőmotor]]
[[hy:Որոնողական համակարգ]]
[[ia:Mechanismo de recerca]]
[[it:Motore di ricerca]]
[[ja:検索エンジン]]
[[ka:საძიებო სისტემა]]
[[kk:Іздеу жүйесі]]
[[kn:ಅಂತರ್ಜಾಲ ಹುಡುಕಾಟ ಯಂತ್ರ]]
[[ko:검색 엔진]]
[[lv:Meklētājprogramma]]
[[mk:Пребарувач]]
[[ml:വെബ് സെർച്ച് എഞ്ചിൻ]]
[[ms:Enjin gelintar]]
[[nl:Zoekmachine]]
[[nn:Søkjemotor]]
[[no:Søkemotor]]
[[os:Агуырды системæ]]
[[pl:Wyszukiwarka internetowa]]
[[pt:Motor de busca]]
[[ro:Motor de căutare]]
[[ru:Поисковая система]]
[[scn:Muturi di circata]]
[[simple:Search engine]]
[[sl:Spletni iskalnik]]
[[sr:Интернет претраживач]]
[[stq:Säikmaskiene]]
[[sv:Söktjänst]]
[[ta:தேடுபொறி]]
[[te:వెబ్ శోధనా యంత్రం]]
[[th:เสิร์ชเอนจิน]]
[[tr:Arama motoru]]
[[uk:Пошукова система]]
[[uz:Veb qidiruv tizimi]]
[[vi:Máy truy tìm dữ liệu]]
[[yi:זוכמאשין]]
[[zh:搜索引擎]]