Tips redaksjonen

Har du forslag til et kult produkt, en ny webtjeneste eller et nytt program som vi bør omtale?

Send en epost til: pcwred@pcworld.no

Endre abonnement

Vil du endre ditt abonnement på PC World?

Kontakt kundeservice på epost eller ring 22 05 30 10.

Trådløsskolen 2

Trådløsskolen 2 handler om hvordan bedrifter bør planlegge implementering av trådløse nettverk, med kapitler om 802.11n, multimedia, administrasjon, tilbudsinnhenting og fremtidens trådløsnett. Last ned her.

Storformatskolen

Storformatskolen handler om storformat, smarte bruksområder og gode tips å ta med seg. Last ned her.

Konfigurasjonsskolen

Konfigurasjonsskolen handler om konfigurasjon og administrasjon av pc-er og programvare. Last ned her.

Trådløsskolen

Trådløsskolen handler om implementering av trådløsnett for bedrifter, med fokus på sikkerhet og teknologi. Last ned her.

Virtualiseringsskolen

Virtualiseringsskolen handler om ulike former for virtualisering, f.eks. virtualisering av nettverk, lagring og maskinvare. Last ned her.

Projektorskolen

Projektorskolen handler om ny projektorteknologi, tips for presentasjoner og kjøpetuide for projektorer. Last ned her.

Skriverskolen

Skriverskolen tar blant annet for seg smarte anvendelser av skrivere, utskriftsøkonomi og tiltak for å spare utskriftskostnader. Last ned her.

ARKIV
Du er her: PC World Norge >
 

Søk på 0,20 sek - hvordan er det mulig?

ANNE SØRUM
08.03.2005 kl 11:47
Utskriftsvennlig side
A A A

I løpet av et tidels sekund kan en søkemotor på internett søke gjennom et hav av websider. Hvordan fungerer egentlig denne teknologien, og hvorfor får du ikke samme resultat når du søker med både Google og Yahoo?

Ved hjelp av søkemotorer på internett kan du finne mye av den informasjonen du er på jakt etter. I løpet et tidels sekund blir enormt mange websider gjennomsøkt, og resultatet blir umiddelbart presentert. Vi forsøker å gjøre et enkelt søk med Google, som kan fortelle at den søker blant 4 285 199 774 websider. Og tiden det tok – snaut 0,20 sekunder. Førsteamanuensis Mark Burgees ved Høgskolen i Oslo forteller mer om denne teknologien.

Innholdet indekseres

I korte trekk er en søkemotor bygd opp av et script som henter ord og bygger lister. Det følger linker og søker gjennom alle tilgjengelige websider. Algoritmene, som er forskjellig fra de ulike søkemotorene, indekserer innholdet fra websidene i en database. Dette blir gjort ut fra blant annet tittel på siden, meta-tagger og url-adresse. Strukturen i databasen er veldig viktig, og her er det mye å hente. Blant annet i forhold til at søket skal gå raskest mulig. Når man gjør et søk på for eksempel et firmanavn, søker motoren etter informasjon som er indeksert, og ligger lagret i søkemotorens databaser. Indeksen har som formål å finne informasjonen raskest mulig. Søkemotorene har gjerne også en liste over de mest populære søkeordene, slik at den til en viss grad er forberedt og kan gjøre søket enda raskere.

Gjør jobben på forhånd

En «crawler», som er et program, leser gjennom alle websidene det finner. De ulike søkemotorene har forskjellige strategier for denne jobben, og en måte kan være å følge linker. Dette er en enorm jobb som tar opptil flere dager, og crawleren oppdaterer informasjonen i databasen/søkemotoren kontinuerlig. Programmet jobber altså hele tiden, for å se etter endringer og oppdateringer av websider. For en søkemotor gjelder det å gjøre det meste av jobben på forhånd – slik at selve søket går raskest mulig. Nøkkelen her er blant annet raske datastrukturer. Under et søk er det forskjell på hva de ulike søkemotorene legger vekt på. Størrelse på databasen, hurtighet ved søk og stabilitet – er blant annet det som skiller søkemotorene fra hverandre.

[idg_break id="845957FD-C8D7-4237-90AFB4F55D8F1AA6"]

Websider blir rangert etter algoritmen til søkemotoren, eller i noen tilfeller av mennesker som leser gjennom informasjonen – og skiller ut det interessante fra det uinteressante subjektivt. De fleste søkemotorer gjør lite for å rangere søkeresultatet, men satser heller på for eksempel raske søk. Her skiller Google seg ut. Ønsker du for eksempel å finne mer informasjon om et emne, er det greit med et søkeresultat som gir den beste informasjonen, det vil si rangert med de mest interessante sidene først. En webside som mange sider peker til, blir ansett som viktig. På denne måten bruker søkemotoren Google andre websiders «valgstemmer» til å rangere sidene. De sidene som får flest stemmer fra andre, blir ansett som best. Jo flere pekere, desto viktigere. Dersom en viktig side peker til din side, blir også du viktigere. Fordi en «viktig stemme» regnes som mer verdt enn en lite viktig stemme. For eksempel ligger hjemmesiden til Høgskolen i Oslo høyt opp i Google. Dette på grunn av et verdenskjent programvareprosjekt ved navnet «cfengine», som høgskolen har produsert. Siden mange refererer til softwaresidene, blir også høgskolens sider viktige. Andre måter å rangere på er i forhold til blant annet nyest eller mest oppdatert informasjon.

[idg_break id="8459580D-C243-931B-148BA8FCB2846B84"]

For å bli funnet av en søkemotor – er det viktig å tilpasse websiden til søkemotorens algoritmer. En god tittel på siden er viktig, og heter den for eksempel Untitled–1 (som er standard) – bør navnet endres til for eksempel firmanavn eller produkttittel. For en søkemotor er det lettere å finne ord og navn ut fra titler og meta–tagger, enn selve innholdet på websiden. Google fungerer slik at websider som ikke kommer med i et søkeresultat, har sannsynligvis ikke nok av andre sider med kobling til den. Dersom andre websider ikke har kobling til en side, gir den ikke siden en såkalt PageRank–rangering. Når det finnes koblinger til en webside, registreres den. Søkemotoroptimalisering er tiltak man også kan gjøre for å tilpasse websiden til søkemotorenes rangeringskriterier. Hos noen leverandører, som for eksempel Yahoo og Kvasir, kan man betale for å komme høyt opp på resultatlisten. Algoritmene til søkemotorene endrer seg stadig, og firmaer tilbyr hjelp med søkemotoroptimalisering. Mange firmaer bruker i dag internett som en markedsføringskanal, og for dem er det en forutsetning å bli funnet på nett.

[idg_break id="8459581C-AFFE-3A6F-0075E7BAAA08BB5C"]

Hvis man ikke ønsker at websiden skal oppdages av en søkemotor, kan man filtrere bort de IP–adressene som søkemotorene bruker – slik at brannmuren nekter tilgang. Søkemotorene legger igjen IP–adresser, og følger man med på loggen på serveren – finner man roboter som snuser rundt for å indeksere sider. I root–katalogen på serveren kan man blant annet inkludere tekstfiler, som beskriver hvilke filer som kan lastes ned fra din server. Robots.txt er en standardfil som forteller søkemotoren hvilken filer den kan laste ned. For utestenging av roboter finnes en standard på http://www.robotstxt.org/wc/norobots.html. Man kan altså legge en fil på serveren som heter robots.txt, og den utestenger robotsøkeprogrammer. Selv om de fleste ser det som en fordel å bli funnet på nett, kan dette særlig være aktuelt for websider som er ment for internt bruk. Det kan også være interessant å følge med for å se hvordan søkemotorene jobber.

På jakt etter ny jobb?

På tide med et kurs?

Del artikkel:
Anbefal artikkel: stem
6 anbefalinger
Henter artikkelkommentarer...
Din kommentar
Tittel:
Kommentar:
Du er ikke logget inn
Logg inn

E-post:
Passord:
Glemt brukernavn/passord?
Glemt brukernavn/passord?
Skriv inn din e-postadresse dersom du har glemt ditt brukernavn eller passord.
e-post:
Registrer ny bruker

Fornavn:
Etternavn:
Forumnavn (nick):
E-post:
Bekreft e-post:
Telefon:
Firma:
Jobbtittel  
Jobbfunksjon  
Ansatte  
Bransje  
   Jeg har lest og aksepterer registreringsvilkårene. Les vilkårene her.  
   Jeg aksepterer å bli kontaktet med tilbud fra IDG sine samarbeidspartnere 

Stortest av GPS-er

Vi har testet seks enheter, fra Garmin, TomTom og Navigon.

Les mer om dette Les mer

Dette koster iPhone 4 deg

Apples nye iPhone 4 er lansert. Vi har prisene til Chess, Netcom og Telenor.

Les mer om dette Les mer hos Macworld

Slik får du iPhone 4 på fredag

OPPDATERT: Noen holder nattåpent, mens andre starter salget klokken 09.00.

Les mer om dette Les mer hos Macworld

Ny, slankere Kindle

Amazon lanserer ny versjon av sitt populære Kindle-lesebrett.

Les mer om dette Les mer

Praktisk kabinett med dokkingstasjon

Thermaltake lanserer pc-kabinettet V6 BlacX med integrert dokkingstasjon for harddisker.

Les mer om dette Les mer

Få varsel når Google spionerer på deg

Google Alarm gir deg beskjed når Google overvåker og registrerer de nettsidene du besøker.

Les mer om dette Les mer

Enkel oppgradering til SSD

Super Talent Technology gjør det enkelt å bytte ut din gamle harddisk med en moderne SSD.

Les mer om dette Les mer

Se de mest omtalte videoene på nettet

Hvilke videoer er det mest blest om på nettet akkurat nå?

Les mer om dette Les mer

Nyhetsbrev
Meld deg på eller endre dine abonnement.
Din epost:  

Tips & guider

Blokker Flash-animasjoner i IE

BRUKERTIPS: Microsoft Internet Explorer 8

Les mer Les mer

Ha kontroll på Facebook

BRUKERTIPS: Bli varslet når noen andre logger inn på kontoen din.

Les mer Les mer

Bygg pc selv: Hva skal du kjøpe?

Bygger du pc-en selv sparer du penger, samtidig som du får den akkurat som du vil. Disse komponentene bør du velge.

Les mer Les mer

Anbefalte tester

Rått med spill på seks skjermer

Å bruke seks bildeskjermer for dataspill kan være en grom opplevelse, men det koster flesk.

Les mer Les mer

TEST: Fiberdrømmen?

Drømmer du om fibertilknytting fra en av Altibox-leverandørene? Vi har testet løsningen i over tre år.

Les mer Les mer

Wimp vs Spotify - hvilken er best?

Norske Wimp tar opp kampen mot svenske Spotify, men hvilken er best? Vi har sammenlignet de to musikktjenestene.

Les mer Les mer

Siste bildeserie

Wimp vs Spotify i bilder

Slik fungerer de to musikktjenestene.

Les mer Les mer

Ikke gå glipp av bladet

PC World nr. 4 i salg nå!

I PC World nr .4 kan du lese test av Apples iPad, se hvordan ekstremoverklokkerne jager nye rekorder, finne ut hvilken nettjeneste for sikkerhetskopi som er best og duell mellom Spotify og Wimp. Pluss mye mer.

Les mer Les mer

I PC Worlds papirutgave finner du de store testene og de lange temaene. Abonnentene får i tillegg ekstramagasinet PC World Bonus.
Harry-arkivet: Nye striper hver fredag!

Ukas Harry Hurt

Se ukas nye Harry-striper her.

Les mer Les mer

Siste kjøpeguide

Bygg pc selv: Hva skal du kjøpe?

Bygger du pc-en selv sparer du penger, samtidig som du får den akkurat som du vil. Disse komponentene bør du velge.

Les mer Les mer


Copyright 2010 IDG Magazines Norge AS. All rights reserved

Postboks 9090 Grønland – 0133 OSLO / online@idg.no / Telefon 22053000

Ansvarlig redaktør Morten Kristiansen / Utviklingsansvarlig Ulf H. Helland / Salgsdirektør Jon Thore Thorstensen