Tips redaksjonen

Har du forslag til et kult produkt, en ny webtjeneste eller et nytt program som vi bør omtale?

Send en epost til: pcwred@pcworld.no

ANNONSEBILAG

Når du krever presisjon

Etter tidligere knallsuksesser med mus, følger Steelseries opp med spillmusen XAI.
 
ARKIV
Du er her: PC World Norge >
 

Søk på 0,20 sek - hvordan er det mulig?

ANNE SØRUM
08.03.2005 kl 11:47

I løpet av et tidels sekund kan en søkemotor på internett søke gjennom et hav av websider. Hvordan fungerer egentlig denne teknologien, og hvorfor får du ikke samme resultat når du søker med både Google og Yahoo?

Ved hjelp av søkemotorer på internett kan du finne mye av den informasjonen du er på jakt etter. I løpet et tidels sekund blir enormt mange websider gjennomsøkt, og resultatet blir umiddelbart presentert. Vi forsøker å gjøre et enkelt søk med Google, som kan fortelle at den søker blant 4 285 199 774 websider. Og tiden det tok – snaut 0,20 sekunder. Førsteamanuensis Mark Burgees ved Høgskolen i Oslo forteller mer om denne teknologien.

Innholdet indekseres

I korte trekk er en søkemotor bygd opp av et script som henter ord og bygger lister. Det følger linker og søker gjennom alle tilgjengelige websider. Algoritmene, som er forskjellig fra de ulike søkemotorene, indekserer innholdet fra websidene i en database. Dette blir gjort ut fra blant annet tittel på siden, meta-tagger og url-adresse. Strukturen i databasen er veldig viktig, og her er det mye å hente. Blant annet i forhold til at søket skal gå raskest mulig. Når man gjør et søk på for eksempel et firmanavn, søker motoren etter informasjon som er indeksert, og ligger lagret i søkemotorens databaser. Indeksen har som formål å finne informasjonen raskest mulig. Søkemotorene har gjerne også en liste over de mest populære søkeordene, slik at den til en viss grad er forberedt og kan gjøre søket enda raskere.

Gjør jobben på forhånd

En «crawler», som er et program, leser gjennom alle websidene det finner. De ulike søkemotorene har forskjellige strategier for denne jobben, og en måte kan være å følge linker. Dette er en enorm jobb som tar opptil flere dager, og crawleren oppdaterer informasjonen i databasen/søkemotoren kontinuerlig. Programmet jobber altså hele tiden, for å se etter endringer og oppdateringer av websider. For en søkemotor gjelder det å gjøre det meste av jobben på forhånd – slik at selve søket går raskest mulig. Nøkkelen her er blant annet raske datastrukturer. Under et søk er det forskjell på hva de ulike søkemotorene legger vekt på. Størrelse på databasen, hurtighet ved søk og stabilitet – er blant annet det som skiller søkemotorene fra hverandre.

[idg_break id="845957FD-C8D7-4237-90AFB4F55D8F1AA6"]

Websider blir rangert etter algoritmen til søkemotoren, eller i noen tilfeller av mennesker som leser gjennom informasjonen – og skiller ut det interessante fra det uinteressante subjektivt. De fleste søkemotorer gjør lite for å rangere søkeresultatet, men satser heller på for eksempel raske søk. Her skiller Google seg ut. Ønsker du for eksempel å finne mer informasjon om et emne, er det greit med et søkeresultat som gir den beste informasjonen, det vil si rangert med de mest interessante sidene først. En webside som mange sider peker til, blir ansett som viktig. På denne måten bruker søkemotoren Google andre websiders «valgstemmer» til å rangere sidene. De sidene som får flest stemmer fra andre, blir ansett som best. Jo flere pekere, desto viktigere. Dersom en viktig side peker til din side, blir også du viktigere. Fordi en «viktig stemme» regnes som mer verdt enn en lite viktig stemme. For eksempel ligger hjemmesiden til Høgskolen i Oslo høyt opp i Google. Dette på grunn av et verdenskjent programvareprosjekt ved navnet «cfengine», som høgskolen har produsert. Siden mange refererer til softwaresidene, blir også høgskolens sider viktige. Andre måter å rangere på er i forhold til blant annet nyest eller mest oppdatert informasjon.

[idg_break id="8459580D-C243-931B-148BA8FCB2846B84"]

For å bli funnet av en søkemotor – er det viktig å tilpasse websiden til søkemotorens algoritmer. En god tittel på siden er viktig, og heter den for eksempel Untitled–1 (som er standard) – bør navnet endres til for eksempel firmanavn eller produkttittel. For en søkemotor er det lettere å finne ord og navn ut fra titler og meta–tagger, enn selve innholdet på websiden. Google fungerer slik at websider som ikke kommer med i et søkeresultat, har sannsynligvis ikke nok av andre sider med kobling til den. Dersom andre websider ikke har kobling til en side, gir den ikke siden en såkalt PageRank–rangering. Når det finnes koblinger til en webside, registreres den. Søkemotoroptimalisering er tiltak man også kan gjøre for å tilpasse websiden til søkemotorenes rangeringskriterier. Hos noen leverandører, som for eksempel Yahoo og Kvasir, kan man betale for å komme høyt opp på resultatlisten. Algoritmene til søkemotorene endrer seg stadig, og firmaer tilbyr hjelp med søkemotoroptimalisering. Mange firmaer bruker i dag internett som en markedsføringskanal, og for dem er det en forutsetning å bli funnet på nett.

[idg_break id="8459581C-AFFE-3A6F-0075E7BAAA08BB5C"]

Hvis man ikke ønsker at websiden skal oppdages av en søkemotor, kan man filtrere bort de IP–adressene som søkemotorene bruker – slik at brannmuren nekter tilgang. Søkemotorene legger igjen IP–adresser, og følger man med på loggen på serveren – finner man roboter som snuser rundt for å indeksere sider. I root–katalogen på serveren kan man blant annet inkludere tekstfiler, som beskriver hvilke filer som kan lastes ned fra din server. Robots.txt er en standardfil som forteller søkemotoren hvilken filer den kan laste ned. For utestenging av roboter finnes en standard på http://www.robotstxt.org/wc/norobots.html. Man kan altså legge en fil på serveren som heter robots.txt, og den utestenger robotsøkeprogrammer. Selv om de fleste ser det som en fordel å bli funnet på nett, kan dette særlig være aktuelt for websider som er ment for internt bruk. Det kan også være interessant å følge med for å se hvordan søkemotorene jobber.

På jakt etter ny jobb?

På tide med et kurs?

blog comments powered by Disqus

TEST: D-Link Sharecenter Pro 1100: Kontorets fellesdisk

D-Link retter sin Sharecenter Pro-NAS mot småbedrifter uten dedikert it-personell.

Les mer om dette Les mer

Nikon D800 – etterlengtet semiproff-kamera

Nye Nikon D800 er et kamera for både entusiaster, semiproffer og profesjonelle fotografer.

Les mer om dette Les mer

Slik er Chrome for Android

Googles Chrome-nettleser er nå tilgjengelig for brukere som kjører Android 4.0.

Les mer om dette Les mer

TEST: Raske proff-SSD-er

Intels og Kingstons nye SSD-er har mye til felles – inkludert å være noe av det raskeste markedet tilbyr.

Les mer om dette Les mer

Vinn HTC Sensation XL med Beats Audio

Nå trekker vi en heldig vinner av HTC Sensation XL med Beats Audio. Svar riktig på 3 spørsmål.

Les mer om dette Les mer

ANNONSEBILAG

Nyt musikken din i hele huset!

Musikk på CD er i ferd med å bli historie. Nå kan du fråtse i åtte millioner låter gjennom musikktjenesten Spotify for bare 99 kroner i måneden.

En ny ordre hvert 24. sekund

Komplett.no har over 21 000 kvadratmeter ved sitt hovedlager i Sandefjord. Herfra betjenes kunder i Norge, Sverige og Danmark.

Komplett.no er Skandinavias største PC-produsent.

Hvert år produserer Komplett.no over 25 000 PC?er. Alle modeller skreddersys etter kundenes egne ønsker og inneholder det nyeste av teknologi.
Tips & guider

Ekstra sikker innlogging på Hotmail

Bruker du ofte Hotmail-kontoen din fra offentlige maskiner? Slik får du enda mer sikker innlogging.

Les mer Les mer

Lydkontrollen som ingen vet om

Individuell volumstyring er en skjult skatt i Windows som veldig få vet om. Dette tipset må du bare lære deg.

Les mer Les mer

Bedre Aerosnap med Aquasnap

Gratisprogrammet som gjør Windows-funksjonen enda bedre.

Les mer Les mer

i samarbeid med JOTTA
Sikker lagring av filene dine på nett Ubegrenset lagringsplass for PC og MAC

Anbefalte tester

TEST: Acers letteste

Acer Aspire S3 er en av de første nye ultraportable som rettes mot konsumentmarkedet.

Les mer Les mer

TEST: Nå kan du glemme piratfilmene - filmleie på nett funker bra

Det er helg og det er høst. Den perfekte tiden for å se film. Vi har testet sju filmtjenester på nett.

Les mer Les mer

TEST: Er den dyreste ruteren best?

Netgear WNDR4500 er blant de aller dyreste wlan-ruterne i sitt segment. Det gir høye forventninger.

Les mer Les mer

Siste bildeserie

Det beste fra CES 2012

BILDESERIE: Ultrabærbare pc-er, smart-tv-er og vanntette mobiltelefoner. Her er noen av produktnyhetene fra CES i Las Vegas.

Les mer Les mer

Siste kjøpeguide

Gjør et kupp på Ebay

PC Worlds Ebay-guide: Spar tusenlapper på smarte kjøp. Og styr unna 200-kronersfellen.

Les mer Les mer

Ikke gå glipp av bladet

PC World nr. 13 i salg!

I PC World nr. 13 kårer vi de mest nyskapende produktene i 2011.

Les mer Les mer

I PC Worlds papirutgave finner du de store testene og de lange temaene. Abonnentene får i tillegg ekstramagasinet SmartWorld.
Harry-arkivet

Harry Hurt

Bla deg gjennom flere år med Harry-klassikere.

Les mer Les mer

Mest anbefalt
Ekstra sikker innlogging på Hotmail-en
 Ekstra sikker innlogging på Hotmail-en
  Facebook:1   Twitter:4
TEST: LG Prada 3.0 - Stilfull og individuell smarttelefon
TEST: Mekaniske tastaturer - Toppmoderne med gammeldags innmat
Sprer falsk antivirus på Facebook
 Sprer falsk antivirus på Facebook
  Facebook:3   Twitter:0
TEST: Intel SSD 520 og Kingston KC100: Raske proff-SSD-er
Slik er Chrome for Android
 Slik er Chrome for Android
  Facebook:3   Twitter:0
Lydkontrollen som ingen vet om
 Lydkontrollen som ingen vet om
  Facebook:1   Twitter:1
TEST: Delovo dLAN 500 AVplus: Praktisk via strømnettet

Copyright 2012 IDG Magazines Norge AS. All rights reserved

Postboks 9090 Grønland – 0133 OSLO / online@idg.no / Telefon 22053000

Ansvarlig redaktør Morten Kristiansen / Utviklingsansvarlig Ulf H. Helland / Salgsdirektør Jon Thore Thorstensen