Klusteri (tietotekniikka)

Wikipediasta
Siirry navigaatioon Siirry hakuun
NEC:n tietokoneklusteri
Applen Xserve Cluster Node

Klusteri on useamman tietokoneen verkotettu malli, jossa yleensä yksi tietokone, joka toimii palvelimena, jakaa muiden tietokoneiden, eli noodien kesken tehtäviä. Näin saadaan esimerkiksi paljon laskenta-aikaa vaativa simulaatio suoritettua lyhyemmässä ajassa. Tämä on verrattavissa moniydinsuorittimeen tai moniprosessoriseen tietokoneeseen.

Klusterointimallit

Korkean tavoitettavuuden järjestelmä ei käytä koko kapasiteettia jatkuvasti, vaan osa järjestelmästä on varalla vikatilanteissa jatkamiseen. "Failover" -tilanteessa suoritus siirtyy varalla olevaan järjestelmään vikaantuneesta järjestelmästä.

Korkean suorituskyvyn järjestelmä käyttää koko klusterin kapasiteettia laskennan tehostamiseen ja muistuttaa yksittäisistä tietokoneista muodostuvaa supertietokonetta.

Verkkopalveluissa klustereita käytetään myös kuormituksen tasaamiseen (engl. load balancing). Tyypillinen käyttökohde on DNS-nimipalvelu.

Pilvilaskenta on abstraktio palveluista ja laskentakapasiteetista, jota kuluttaja voi ostaa. Tämä ei varsinaisesti määrittele klusterointia mutta usein tarkoittaa klusterin käyttämistä palvelun tuottamiseen. Pilvilaskenta voidaan tarkoituksesta riippuen toteuttaa myös suurtietokoneella ajetuilla virtuaalikoneilla eikä varsinaista tietokoneklusteria.

Historiaa[muokkaa | muokkaa wikitekstiä]

Digital Equipment Corporation kehitti ensimmäiset mallit klustereista 1980 VAX-minitietokoneelle VMS-käyttöjärjestelmälle. Se ei ainoastaan tukenut rinnakkaista ajoa vaan myös levytilan ja oheislaitteiden jakamista.

Hajautettuja käyttöjärjestelmiä ovat kehittäneet muun muassa Apollo Computer (Domain/OS) ja Bell Labs (Plan 9).

Tekniikka[muokkaa | muokkaa wikitekstiä]

Klusterissa muistiarkkitehtuuri on hajautettu (engl. Distributed Memory).[1] Toisin kuin symmetrisessä moniprosessointitietokoneessa klusterin eri solmut (engl. node) vaativat oman kopion käyttöjärjestelmän ytimestä ajettavaksi.[1]

Distributed Lock Manager (DLM) tarjoaa klusterissa yhdessä toimiville prosesseille hallitun pääsyn resursseihin kuten levyihin tai ohjelmiin.[2] Tiedostojärjestelmät kuten OCFS2 ja GFS2 käyttävät DLM:ää.[3]

Järjestelmiä[muokkaa | muokkaa wikitekstiä]

Jyväslaskenta[muokkaa | muokkaa wikitekstiä]

Jyväslaskennan (tai ryväslaskenta) malli (engl. grid) – tarkoittaa myös verkkoa. Tämän tarkoitus on mahdollistaa hajautettu laskenta ympäri maailmaa usealla tietokoneella hyödyntäen alueellisia palvelimia jakamassa tehtäviä pieninä paketteina kotikoneille tai muille vastaaville laitteille. Usein grid-sovellutukset nojaavat vapaaehtoisten apuun. Näissä vapaaehtoistyöhön nojaavissa projekteissa on ideana, että asiakasohjelman asentaminen on käyttäjälle helppoa ja että saadaan halvalla paljon laskenta-aikaa. Mallia käytetään hyvin paljon tieteellisissä paljon laskentatehoa vaativissa projekteissa, kuten:

Yksi tunnetuimmista grid-projekteista on SETI@home. Vaikkakin tämän projektin tarkkaa laskentatehoa ei voida mitata, koska käytössä olevien koneiden määrä vaihtelee, on se kuitenkin laskelmien mukaan maailman tehokkain yksittäinen supertietokone. Nykyään SETI@home käyttää Berkeleyn yliopiston kehittämää BOINC-järjestelmää (Berkeley Open Infrastructure for Network Computing}. Tällaisen voi huoletta asentaa vaikka kotikoneelle ja pitää sitä aina päällä kun konekin on. BOINC, kuten jo moni sen edeltäjistä, ovat sen verran kehittyneitä, että ne käyttävät vain sen verran laskenta-aikaa, mitä muilta prosesseilta jää yli. Tämä hoidetaan ohjelmien priorisoimisena. BOINC on jossain määrin verrattavissa idle-prosessiin.

Vaikkakin grid-laskennassa ei ole välttämätöntä käyttää tuhansia koneita maailmanlaajuisesti, saman voi tehdä harrastelija kotona esimerkiksi kymmenellä koneella käyttäen Mosixia hyväkseen, yleisesti ottaen kun puhutaan Grideistä tarkoitetaan tällaisia suuria tietokoneiden verkostoja.

openMosix[muokkaa | muokkaa wikitekstiä]

openMosix on vapaa versio MOSIX-järjestelmästä. Molemmat on tarkoitettu ajettavaksi Linux-ympäristössä sekä ovat ilmaisia. Ainut konkreettinen eroavaisuus näiden järjestelmien välillä on lisenssi. openMosix julkaistaan GPL:n alaisenta ja Mosixin lisenssi on hieman rajoittuneempi.

Mosix[muokkaa | muokkaa wikitekstiä]

Mosix-järjestelmät on tarkoitettu hieman tiukemmin sijoitettuun ympäristöön kuin Grid sellaisena kuin se yleisesti ymmärretään. Ne eivät myöskään ole yhtä helposti laajennettavissa. Mosixien hienouksiin kuuluu muun muassa käynnissä olevan prosessin siirtäminen noodilta toiselle ilman prosessin sammuttamista. Mosix on hyvin käytännöllinen ratkaisu esimerkiksi kotona 3D-mallinnusta harrastaville ja sopii myös normaalin koneen käyttöön. Ensisijaisesti nämä ovat kuitenkin klusteroituja supertietokoneita varten.

Beowulf-klusteri[muokkaa | muokkaa wikitekstiä]

Beowulf-klusteri The Borg

Beowulf-klusteri on niille, joille ei valmis tuote kelpaa. Toinen nimitys Tee-se-itse Linux/Unix -klusteri. Järjestelmän etuna on, että se toimii kuten on haluttu, eikä siinä ole ylimääräisiä prosesseja kuluttamassa resursseja. Myös järjestelmän malli voi olla tavallisuudesta poikkeava. Beowulf-klusterit tyypillisesti käyttävät valmiita yleisesti saatavilla olevia komponentteja (COTS).

Ensimmäiset Beowulf-klusterit kehitettiin vuonna 1993 NASA:ssa.[7][8]

Windows-klusterit[muokkaa | muokkaa wikitekstiä]

Windows-klusteri ei ole kovin suosittu ratkaisu hintansa ja suljetun ympäristön vuoksi, mutta joissakin tapauksissa niiden käyttö on välttämättömyys. Windows-klusterin etuja Unix-malleihin verrattuna ovat helposti skaalautuva järjestelmä ja nopea asennettavuus.lähde? Ne hallitsevat myös verkon kuorman jakamisen. Microsoftilla on kehityksessä oma Windows-käyttöjärjestelmä joka on suunniteltu erityisesti supertietokoneita varten.lähde?

Klusteri ja verkkoteoria[muokkaa | muokkaa wikitekstiä]

Verkkoteoriassa klusteri tarkoittaa verkon (järjestelmän) sisäistä, voimakkaasti verkotettua kokonaisuutta, sen sisäistä organisaatiota.

Klusterin "vastakohta" on järjestelmän liittyminen muuhun kokonaisuuteen, olemassaoloon, eli ns. heikot yhteydet. Jälkimmäiset ovat nimestään huolimatta systeemeille erityisen tärkeitä. Ihmisverkoissa ne esimerkiksi antavat klusterin yhtenäisestä tiedosta poikkeavaa, laajempaa tietoa.

Järjestelmän raja muodostuu klusterin ja heikkojen yhteyksien rajalle.

Klusteroitu levyjärjestelmä[muokkaa | muokkaa wikitekstiä]

Klusterointia voidaan hyödyntää tiedon prosessoinnin lisäksi myös tiedon tallentamiseen, jolloin käytetään RAID-tekniikkaa tai klusteroitua levyjärjestelmää.

Klusteroitu levyjärjestelmä tarkoittaa useiden kiintolevyjen tai levyryhmien käyttöä hajautetusti. Nämä jaetaan pääasiassa kahteen ryhmään: hajautettu levyjärjestelmä sekä jaettu levyjärjestelmä.

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b Categories of Computer Systems, Flynn’s Taxonomy .cs.uidaho.edu. Viitattu 19.2.2017.
  2. Distributed Lock Manager .phys.canterbury.ac.nz. Viitattu 10.7.2021. (englanniksi)
  3. 18 Distributed Lock Manager (DLM) documentation.suse.com. Viitattu 10.7.2021. (englanniksi)
  4. lifesaver (Arkistoitu – Internet Archive)
  5. Climateprediction (Arkistoitu – Internet Archive)
  6. SETI@home
  7. Phil Merkey: Beowulf History beowulf.org. Viitattu 15.11.2017.
  8. ​Linux totally dominates supercomputers 14.11.2017. ZDnet. Viitattu 15.11.2017.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Commons
Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Klusteri (tietotekniikka).