Een zoekmachine (Engels: "search engine") is een instrument waarmee men informatie kan zoeken in een bepaalde collectie; dit kan een bibliotheek, het internet, of een persoonlijke verzameling zijn. Zonder nadere kwalificatie bedoelt men tegenwoordig meestal een webdienst waarmee met behulp van vrije trefwoorden volledige tekst (full text) kan worden gezocht in het gehele World Wide Web.
In tegenstelling tot startpagina's of webgidsen is er geen of zeer weinig menselijke tussenkomst nodig; het bezoeken van de webpagina's en het sorteren van de rangschikkingen gebeurt met behulp van een algoritme.
Google is in de Benelux de meest gebruikte zoekmachine, in andere landen zijn ook Yahoo!, MSN Search, Baidu, ... populaire zoekmachines.
Inhoud |
Zoekmachines indexeren webpagina's geautomatiseerd door middel van robots/spiders. Dit zijn programma's die webpagina's downloaden en vervolgens nuttige informatie verzamelen van de pagina, zoals woorden en links. De links worden weer aan de spider als input gegeven om weer gedownload te worden. De gevonden woorden worden opgeslagen in een gigantische database.
De zoekmachines werken met verschillende technieken. Oorspronkelijk werkten de zoekmachines met de door de webmasters zelf opgegeven zoektermen (keywords), maar daar werd veel misbruik van gemaakt doordat de webmasters keywords gingen gebruiken die veel publiek trokken, maar geen verband hielden met de inhoud van de pagina, zoals het woord 'sex'.
Daarom werden diverse andere alternatieve technieken ontwikkeld. Zo werkt Google onder andere met de populariteit van de websites: het aantal malen dat een website op andere websites wordt vermeld. Op de websites van de zoekmachines is meestal wel informatie te vinden over hoe ze werken.
Het aantal spider-based-zoekmachines is beperkt. Grote internationale zoekmachines zijn Google, Teoma, Windows Live Search en Yahoo. Bekende Nederlandse zoekmachines bedoeld om te zoeken naar Nederlandstalige pagina's zijn Kobala, Ilse en voorheen ook Track. Walhello is een in Nederland ontwikkelde internationale zoekmachine.
Er zijn ook metazoekmachines, zoekmachines die werken via de resultaten van andere zoekmachines. Voorbeelden zijn Metacrawler, Ixquick en Ez2Find. Nederland kent ook metazoekmachines zoals Zoeken.nl, Multizoeker, Metaspider.nl, Zoekal en Laquza.
De meeste zoekmachines zijn bedoeld om iets op het web te vinden via het HTTP-protocol. Het gaat dan om informatie die ook met een browser bekeken kan worden. Daarnaast kunnen sommige zoekmachines ook informatie in nieuwsgroepen vinden. Bijvoorbeeld Google kopieert veel nieuwsgroepen naar de eigen servers, zodat daar in gezocht kan worden. Tot slot zijn er enkele zoekmachines die kunnen zoeken naar bestanden via het File Transfer Protocol.
Zoekmachine Marketing(search engine marketing) is het geheel aan activiteiten bedoeld om een webpagina hoog te laten scoren in de zoekresultaten van een zoekmachine, op voor de webpagina relevante trefwoorden of zoektermen. Zoekmachine Marketing bestaat uit twee onderdelen:
Een andere manier om 'hoog te scoren' bij zoekmachines is adverteren. Aanvankelijk kon er tegen betaling een plaats hoog in de ranking 'gekocht' worden als advertentie. Tegenwoordig is het bij bijna alle zoekmachines zo dat een dergelijke praktijk niet meer mogelijk is, omdat gebruikers het niet meer accepteren. In plaats daarvan worden er op een aparte plaats (vaak aan de rechterkant, soms ook bovenaan) zogenaamde 'gesponsorde koppelingen' getoond. Dit wordt door gebruikers als minder storend ervaren, omdat 'echte resultaten' en advertenties duidelijker te onderscheiden zijn.
De advertentieruimte bij de gesponsorde koppelingen wordt meestal 'verkocht' per opbod via het 'pay per click' systeem. Bij bijvoorbeeld Google Adwords wordt de positie bij de gesponsorde koppelingen bepaald door de bieding van de adverteerder te vermenigvuldigen met de Click-Through Rate. Steeds meer commerciële bedrijven en instellingen ontdekken deze vorm van adverteren. Op dit moment (september 2006) wordt meer dan de helft van de online marketingbestedingen aan zoekmachinemarketing uitgegeven.
Om de hegemonie van marktleiders als Google te ontlopen richten sommige zoekmachines zich op een bepaald specialisatiegebied. Ook wel verticale zoekmachines genoemd. Omdat zij speciaal zijn geconfigureerd om juist voor dit gebied de beste resultaten naar boven te halen denken zij het hierop beter te doen dan algemene zoekmachines.
Een van die specialisatiegebieden is de academische wereld. Elsevier richt zich met Scopus op deze niche, waarmee zowel wetenschappelijk tijdschriften worden doorzocht, als wel de academische kennis op het Internet door gebruik te maken van Scirus. Web of Science (van Thompson Isi) is een concurrent die negenduizend tijdschriften en een krantenarchief van zestig jaar doorzoekt. Google probeert met Google Scholar zelf ook een speler in deze markt te worden. OAIster van de Universiteit van Michigan richt zich op wetenschappelijke informatie die door ruim duizend universiteiten en onderzoekscentra via Digital Academic Repositories beschikbaar wordt gemaakt. De MedischeZoekmachine.nl richt zich speciaal op medische zoektermen.
Een andere specialisatiegebied voor zoekmachines zijn diensten en consumentenproducten. Voor het vinden op de Nederlandse markt van huizen zijn Jaap.nl en Zuka.nl gespecialiseerd, voor vacatures Askjim.nl en voor auto's Gaspedaal.nl. Het Nederlandse El Cheapo heeft zich gespecialiseerd in het vergelijken van bepaalde producten bij verschillende aanbieders. Google doet hetzelfde met Froogle.
Onderwijsinformatie is te vinden met Davindi.
Naast de vele voordelen van zoekmachines zoals Google, kleven er ook nadelen aan het gebruik van grote zoekmachines. Door de toename van data wordt het steeds moeilijker om gerichter te kunnen zoeken op een bepaald gebied, of in een andere taal dan het Engels. Vaak kun je op kleine, regionale zoekmachines', zoals hierboven staat beschreven, wel specifieke informatie krijgen in jouw taal, maar bij dit soort zoekmachines ontbreken de zoek –en analysekwaliteiten. Voor vele grote zoekmachines is het een uitdaging om ook deze kleine, regionale sites te betrekken in hun zoekresultaten.
Doordat zoekmachines heel internet in kaart kunnen brengen vormen ze ook een probleem inzake privacy.
Chung et al (2006) “SpidersRUs: Creating specialized search engines in multiple languages,” Decision Support Systems,, nr. 42, pp. 1697-1714
Chau et al (2007) “Supporting non-English Web searching: An experiment on the Spanish business and the Arabic medical intelligence portals,” Decision Support Systems
Hargittai, E. (2007) “The social, political, economic, and cultural dimensions of search engines: An introduction,” Journal of Computer-Mediated Communication, nr. 12
Guan, T en K. F. Wong (2003) “Nstar: an interactive tool for local web search,” Information & Management, nr 41, pp. 213-225
Braun-LaTour et al (2007) “Mood, information congruency, and overload,” Journal of Business Research, nr. 60, pp. 1109-1116