Med Grid Computing menes å benytte ressursene fra flere datamaskiner i et nettverk til å løse ett enkelt problem, samtidig. Slike problemer kan være vitenskapelige eller tekniske, og felles for dem er at de krever tilgang til store maskinressurser eller til store datamengder.
Et godt eksempel på Grid Computing er SETI (Search for Extraterrestrial Intelligence) et prosjekt som pågår i dag, og som flerfoldige tusen brukere på Internett samarbeider om. De benytter ubrukte ressurser i sine datamaskiner for å være med på å søke etter tegn på «rasjonelle» signaler fra verdensrommet.
Flere store prosjekter
Grid Computing krever bruk av programvare som kan dele opp og distribuere biter av et program til så mange som tusener av datamaskiner. Grid Computing kan dermed sees på som distribuert og storskala Cluster Computing, og som en form for nettverksdistribuert parallellprosessering. Det kan begrenses til å omfatte et nettverk av datamaskiner innenfor en organisasjon, eller det kan ta form av et offentlig samarbeide mellom tusenvis av datamaskiner.
Flere organisasjoner, profesjonelle grupper, universiteter og andre har utviklet, eller er i ferd med å utvikle rammeverk og programvare som kan sette dem i stand til å styre og kontrollere Grid Computing-prosjekter. EU sponser eksempelvis flere slike prosjekter. I USA arbeider «The National Technology Grid» med prototyper for Grid-infrastruktur og en Grid som kan benyttes av vanlige mennesker. Oracle Corp. hevder at de med introduksjonen av Oracle 10g (g står for grid) kan levere både programvare og administrasjonsverktøy som kan realisere Grid Computing. Også flere andre leverandører hevder de kan levere Grid Computing, bl.a. Sun Microsystems med sin Grid Engine-programvare.
Hype eller realisme?
Om man tar inn over seg hva leverandører som IBM, Hewlett-Packard, Sun Microsystems eller Oracle Corp. sier og skriver i disse dager, vil vi høre og se svært mye om Grid Computing. Konseptet kan nok ha forskjellige navn som utility computing, power on-demand, autonom databehandling og adaptiv databehandling, men essensen i det hele vil nok være dette at en vil kunne oppnå en mirakuløs økning i kostnadseffektiviteten ved å utnytte ledige «sovende» maskinressurser.
Hvis vi så tror på disse ulike beskrivelsene av Grid Computing (alle har de sin favoritt) er vi på full fart inn i et IT-nirvana hvor prosesseringskraft og applikasjoner vil bli dynamisk rekonfigurert og levert fra en stor virtuell pool av ressurser. Data vil være sikret, men være tilgjengelige fra hvor som helst, og nettverkskompleksitet vil være skjult. Vil dette ikke bli flott når det engang kommer?
En lovende teknologi
Grid Computing virker imidlertid som en lovende teknologi og først og fremst av tre grunner. For det første teknologiens evne til å gjøre mest mulig kostnadseffektiv bruk av en gitt mengde datamaskinressurser. Deretter som en metode for å kunne løse datarelaterte problemer som er av en slik kompleksitet og størrelse at en vanskelig kan finne datamaskiner som er kraftige nok til å løse dem alene.
Til slutt fordi teknologien antyder at ressurser fra mange, ofte ulike datamaskiner, kan kooperativt og kanskje synergistisk benyttes og ledes som en «samarbeidsmaskin» rettet mot et felles mål.
Bedre utnyttelse av dataressurser
Som vi har sett er Grid Computing som konsept relativt enkelt. Det refererer vanligvis til en form av distribuert databehandling i hvilken forskjellige teknologiske komponenter som PCer og lagringsutstyr er lenket sammen på tvers av en organisasjon, eller mellom flere organisasjoner, med det for øye å løse et felles problem. Konseptet er fristende i den forstand at det lover bedre utnyttelse av eksisterende infrastruktur, noe som er svært så aktuelt i tider som dette med magre IT-budsjetter.
Grid Computing er av de fleste betraktet som en «kommende teknologi» så det vil kanskje forbause noen at konseptet allerede har ankommet, og er implementert i mange organisasjoner. Disse organisasjonene har ofte mangfoldige tusen PCer installert, og hele «farmer» av servere som representerer en signifikant grad av overkapasitet.
Prosessen forbundet med å installere en ny applikasjon fører som oftest med seg innkjøp av enda en ny server eller to. Disse serverne er som oftest også mye kraftigere enn det som kreves for å kunne kjøre den førnevnte applikasjonen.
To typer Grid
Naturligvis ville det være fornuftig å bruke denne overkapasiteten, men å kunne gjøre det er forbundet med problemer. Det viktigste problemet er at det ikke finnes noe programvare som kan fungere som «operativsystem» for hele nettverket – i den forstand at det kunne oppdage ledige ressurser, og kunne styre jobber til å kunne utnytte denne ressursen.
Samtidig, om det fantes slik overordnet programvare, finnes det ikke så mange applikasjoner som er utviklet for å kunne utnytte et distribuert sett med ressurser.
Det finnes i utgangspunktet to typer av Grid.
Den første som vi kan kalle en Datagrid blir brukt til å dele informasjon. En slik Grid kan sammenlignes med hvordan vi deler og henter ut informasjon over Internett, men her dreier det seg om mer spesialisert innhold, og en større fokus på datamaskinressurser. IBM og University of Pennsylvania samarbeider i dag om å bygge en Grid som kobler sammen flere universitetsklinikker med det for øye å dele informasjon og analytiske verktøy i forbindelse med mammografiske undersøkelser.
Den andre typen Grid vi snakker om er en «databehandlende» Grid. En slik Grid er for tunge tallknuseoppgaver.
Den kinesiske Grid
IBM og Kinas utdanningsdepartement har annonsert at de har startet med å benytte Grid-teknologi for å sette universiteter over hele Kina i stand til å samarbeide om vitenskapelige og utdanningsrelaterte prosjekter. Dette er en av verdens største implementasjoner av Grid Computing, og her hentes det ut data og maskinressurser og gjør dem tilgjengelige hvor de behøves, i form av ett enkelt virtuelt system.
Det kinesiske «China Education and Research Grid», det mest ambisiøse statlige Grid-prosjektet til dags dato, blir startet opp denne måneden ved seks universiteter, og vil når det er ferdig lenke sammen mer enn 200 000 studenter og fakultetsmedlemmer ved mer enn hundre universiteter over hele Kina. Når den første fasen av prosjektet er ferdig i 2005 vil Grid-systemet utføre mer en seks teraflops (trillioner kalkulasjoner pr. sekund), og vil når det er fullført yte mer enn 15 teraflops.
Grid-systemet i Kina bygger på ny Web Services-teknologi i WebSphere, IBMs programvare for Internett-relatert infrastruktur, og omfatter blant annet OGSA (Open Grid Services Architecture)-standarder. 49 av IBMs eServer xSeries Linux-baserte servere er i bruk, og seks pSeries servere som kjører AIX. I tillegg benyttes IBM TotalStorage FAStT200 servere for datalagring.
Den kinesiske Griden vil gjøre det enklere for studenter og forskere å kunne aksessere utdanningsrelaterte og ytelsesrelaterte ressurser over hele Kina. Universitetene vil bli koblet opp mot en felles virtuell hub som automatisk finner frem til passende applikasjonsressurser for medisinsk forskning, videobaserte kurs og e-læring.
Lite standardisering
Grid Computing er et såpass nytt konsept at det i dag ikke finnes noen tekniske standarder eller programvare som gjør det mulig å sette sammen en Grid på en enkel og billig måte. Det som trengs er først og fremst en eller annen form for mellomvare som kan knytte sammen de datatekniske elementene, og samtidig programvare som «vet» hvilke ressurser som til enhver tid er ledige, og som derved kan tildeles arbeid.
I tillegg vil bedriftene måtte forsikre seg om at enhver applikasjon som skal kjøres på Grid-systemet aksepterer distribuert datakraft. Slik programvare er det lite av foreløpig. På toppen av det hele må nok de som ønsker å utvikle et Grid-system belage seg på å måtte utføre ganske mye integrasjonsarbeid selv. De Grid-systemene som i dag er i drift er i høyeste grad skreddersydde med hensyn på integrasjon mellom tilgjengelige produkter.
Dell har norgeslansert ferdige pakker med servere, lagring og nettverk for virtualisering. Produktserien heter «Dell vStart».
Lenovo ThinkPad X1 Hybrid er en ny bærbar som kommer med to prosessorer og to operativsystemer.
Analyseplattformen Apache Hadoop har kommet i versjon 1.0 etter sju års utvikling.
Datasentre sliter med burst-trafikk i mellom servere, kan trådløst være løsningen?
Ny amerikansk antipiratlov møter knallhard motstand, både i USA og i resten av verden.
En gedigen 4,7-tommers skjerm, bra spesifikasjoner og et flott brukergrensesnitt gjør nye HTC Titan til en fryd å bruke.
Nettverk & Kommunikasjon utgis avCopyright 2012 IDG Magazines Norge AS. All rights reserved
Postboks 9090 Grønland – 0133 OSLO / online@idg.no / Telefon 22053000
Ansvarlig redaktør Morten Kristiansen / Utviklingsansvarlig Ulf H. Helland / Salgsdirektør Jon Thore Thorstensen