Gå til innhold

Raid-5. Ønsker å fordype meg i raid5 funskjoneren.


Anbefalte innlegg

Raid5

 

Her ser dere det bildet jeg har funnet på Internett. Men poenget mitt er at jeg skal veilede andre i hvordan raid5 fungerer, slik at det er lett forståelig for andre å lese.

 

For eksempler har dette raidsoppsettet på bildet fem grupper som inneholder 4 harddisker i hver gruppe. Raid5 består av både striping og partiet. Det vil da si oss at block A (gruppa-1) består av de fire harddiskene, og tre av dem striper hverandre, mens den siste harddisken brukes til å lagre partiinformasjon.

 

Mulig at jeg har oppfattet feil og har da også en annen teori.

 

Block A, Block B, Block C, Block D og Block E samarbeider med hverandre for å stripe hver harddisk som ligger i det øverste nivået av alle gruppesylinderene. Hver harddisk i det øverste nivået av gruppesylinderene lagrer også partiinformasjon for å bedre sikkerheten.

 

Det andre nivået i gruppesylinderen gjør det samme som det øverste nivået i gruppesylinderen. Og for så vidt er det, det samme med resten av alle de tre siste nivåene.

 

Men hvordan klarer egentlig Raid5 å kjøre striping av harddiskene uten å gå tapt for viktige data? I tillegg sløser ikke Raid5 bort lagringsplass som Raid-1 (speiling) gjør. Har også lest at 3/4 av harddiskene i en raidfunksjoner settes i bruk, mens 1/4 brukes til "backup".

 

Før hadde PC-World levende bilder av forskjellige raidfunksjoner, men nå er de borte fra deres side. På den tiden interesserte jeg meg ikke for i Raid 5 og mistet muligheten for å lære hvordan Raid 5 egentlig fungerte.

 

Hvis noen av dere har bra kunnskaper om Raid 5 eller vet om et bra sted for beskrivelse av Raid 5, er dere bare hjertlig velkommen til å komme ut med alt dere vet om raid 5.

 

Med hilsen fra meg

Lenke til kommentar
Videoannonse
Annonse

Mener at det er slik at du kan miste en disk i et raid 5 oppsett.

Grunnen er at hvis du har feks 4 disker, så vil du kunne utnytte 3/4 av plassen på diskene til lagring av data, den siste 1/4 av plassen brukes til å generere en slags backup av de lagrede dataene.

Du vil med andre ord "tape" mindre plass "prosent hvis" jo flere disker du bruker.

 

 

Kent

Lenke til kommentar

RAID 5 bruker paritet som feilkontroll, og du vil alltid miste lagringsplassen til en av diskene, ikke nødvendigvis en fjerdedel.

 

Når en setter paritet, må denne settes til even eller odd, og da er det snakk om partall eller oddetall antall 1'ere i rekken.

 

La oss si at vi bruker even parity, på tre disker

 

D= data P=Paritet

 

 

Disk1 Disk2 Disk3

D 1 | D 0 | P 1 Her settes paritet til 1 for å få even parity

D 1 | P 0 | D 1 Her settes paritet til 0 for å få even

P 1 | D 0 | D 1 Her settes paritet til 1 for å få even parity

 

 

Hvis du nå fjerner en disk vil du se at du kan bygge opp igjen den disken som har forsvunnet.

 

RAID 5 benytter selvfølgelig en større algoritme, men prinsippet er det samme.

Endret av xoop
Lenke til kommentar

1 disk går bort til paritetsdata i et RAID 5, dvs. du har størst 'tap' av lagringsplass om du kjører 3 disker, da mister du 1/3 av den totale plassen, har du derimot 8 disker i arrayet forsvinner kun 1/8 av den totale kapasiteten.

 

Paritet regnes ut med den logiske funksjonen XOR (eXclusive OR), slik:

 

a | b | (a XOR b )

---------------------

0 | 0 | 0

0 | 1 | 1

1 | 0 | 1

1 | 1 | 0

 

Du vil se at hvis du tar bort f.eks. a, så kan du gjenskape a ved å regne ut XOR for paritetsinformasjonen (det opprinnelige XOR resultatet) og b.

 

Paritetsinformasjonen finnes spredd på alle diskene, ikke kun på en disk som i RAID 3 (om jeg husker rett).

 

Du kan finne mye om RAID 5 ved å søke på Google, men her er en link iallefall: http://www.pcguide.com/ref/hdd/perf/raid/l...leLevel5-c.html

 

timtowtdi

Lenke til kommentar
RAID 5 bruker paritet som feilkontroll, og du vil alltid miste lagringsplassen til en av diskene, ikke nødvendigvis en fjerdedel.

 

Når en setter paritet, må denne settes til even eller odd, og da er det snakk om partall eller oddetall antall 1'ere i rekken.

 

La oss si at vi bruker even parity, på tre disker

 

D= data P=Paritet

 

 

Disk1 Disk2 Disk3

D 1 D 0 P 1 Her settes paritet til 1 for å få even parity

D 1

Hei.

 

Ja, men det vil vel si at to harddisker i oppsettet ditt striper hverandre. Den siste harddisken jobber med å lagre Paritetinformasjon fra de to harddiskene som striper hverandre. Jeg har fortsatt litt vanskelighet med å forstå det.

 

En fil blir vel delt i to og lagret i hver sin ende i de to harddiskene(stripingsoppsett). Men i Raid5 oppsettet med tre harddisker, blir vel den siste harddisken brukes til å lagre partietinformasjon og står mellom de to harddisker som striper hverandre?

Lenke til kommentar

Alle diskene er like ingen av diskene har noen spesiell oppgave.

Alle diskene har paritets informasjon.

 

Hvis det var på den måten som du skiserer, så ville hele arayet rase hvis den disken med paritets informasjonen ble ødelagt!! (Mulig at jeg missforstod hva du mente)

 

 

 

Kent

Lenke til kommentar
1 disk går bort til paritetsdata i et RAID 5, dvs. du har størst 'tap' av lagringsplass om du kjører 3 disker, da mister du 1/3 av den totale plassen, har du derimot 8 disker i arrayet forsvinner kun 1/8 av den totale kapasiteten.

 

Paritet regnes ut med den logiske funksjonen XOR (eXclusive OR), slik:

 

a | b | (a XOR b )

---------------------

0 | 0 | 0

0 | 1 | 1

1 | 0 | 1

1 | 1 | 0

 

Du vil se at hvis du tar bort f.eks. a, så kan du gjenskape a ved å regne ut XOR for paritetsinformasjonen (det opprinnelige XOR resultatet) og b.

 

Paritetsinformasjonen finnes spredd på alle diskene, ikke kun på en disk som i RAID 3 (om jeg husker rett).

 

Du kan finne mye om RAID 5 ved å søke på Google, men her er en link iallefall: http://www.pcguide.com/ref/hdd/perf/raid/l...leLevel5-c.html

 

timtowtdi

Nå begynner jeg å forstå litt bedre. Jeg er ikke god i engelsk, men etter å ha studert litt på bildet i den urlen du ga meg begynte jeg å forstå litt mer.

 

På DISK-1 blir full grønn data lagret der. På disk-2 blir det lagret halvparten av full grønn data der. På disk-3 er det ca 70% lagret av full grønn data der. På Disk-4 er det også av full grønn data lagret. Hver disk av dette oppsettet inneholder partietinformasjon om hver disk.

 

Det grå feltet over grønn data på disk-1 er partietinformasjon til grønn data.

Det grå feltet som har okkupert plassen til det grønne feltet på Disk-2, inneholder partietinformasjon til grønn data.

Det grå feltet under grønn data på disk-2 er partietinformasjon til grønn data, det grå feltet har også okkupert plassen til det grønne feltet.

Partietinformasjonen om grønn data fins ikke på disk-4 for det er full lagret av grønn data der.

 

Det med fiolette data er det samme som jeg har oppfattet ved grønn data, men bare at de er blitt lagret omvendt som det med grønn data for å ha forskjellige rutiner.

 

Blå og rødt har jeg ikke fått med meg hva det er. Men de hvite må være ¼ av plassen som ikke vises frem?

 

Stemmer alt det jeg har skrevet?

Lenke til kommentar

For de som vil sette seg litt in i RAID anbefaler jeg :

http://eval.veritas.com/webfiles/docs/RAIDirectorWP.pdf

 

"A Technology White Paper from VERITAS Software Corporation"

Tittel : Raid for Enterprice Computing

 

Denne mener jeg er en god begynnelse, og gir en god innføring i ulike RAID konfigurasjoner - virkemåte - fordeler - ulemper - osv

 

Anbefales, men noe forkunnskaper bør en dog ha, ellers kan den bli noe tung.

Endret av Blacksheep
Lenke til kommentar

 

Det med fiolette data er det samme som jeg har oppfattet ved grønn data, men bare at de er blitt lagret omvendt som det med grønn data for å ha forskjellige rutiner.

 

Blå og rødt har jeg ikke fått med meg hva det er. Men de hvite må være ¼ av plassen som ikke vises frem?

 

Stemmer alt det jeg har skrevet?

De forskjellige fargene representerer enkeltfiler med forskjellig størrelse, og viser hvordan de blir fordelt ut over diskene. De grå feltene representerer paritetsdata.

 

Vil bare legge til at det er vanlig å ha sk. 'hot-spares' (dvs. disker som står stand-by og ikke er i bruk) i et RAID, slik at hvis en disk feiler overtar en 'hot-spare' og arrayet bygges opp igjen automatisk.

 

Som regel er også diskene montert i hot-swap skuffer slik at man kan bytte disker uten å måtte slå av serveren.

 

RAID i profesjonelle løsninger er (nesten) alltid basert på SCSI.

 

timtowtdi

Lenke til kommentar

Det kommer jo selvfølgelig an på hvor lite du forstår det selv, og hvor lite de du skal forklare det til fra før av kan. Jeg jobber i bransjen, og har av den grunn vært på diverse kurs som har toucha innom teorien rundt bl.a raid 5.

Der har de gjerne starta med å illustrere det slik (ganske unøyaktig og grovt forenkla):

 

 

Disk:   1  |  2  |  3  |  4

----------------------------

Data1: -2- |  1  |  1  |  0

Data2:  0  | -4- |  3  |  1

Data3:  1  |  3  | -5- |  1

Data4:  0  |  0  |  1  | -1-

 

Tallene som er uthevet er en sjekksum for linjene, og samme hvilken disk som forsvinner så kan man finne ut hva som sto på hver enkelt linje. Forsvinner to disker er det umulig.

 

Som sagt kommer det an på hvorfor du skal lære noen om raid 5 og hva de kan fra før, men jeg synes dette er en god innfallsvinkel hvis man ikke skal programmere/utvikle hw/sw, men bare forstå grunnprinsippene.

Endret av dsgf
Lenke til kommentar
De forskjellige fargene representerer enkeltfiler med forskjellig størrelse, og viser hvordan de blir fordelt ut over diskene. De grå feltene representerer paritetsdata.

Jeg kjører selv RAID5 med 4 SCSI disker på serveren min og må si jeg ble litt "skremt" av denne illustrasjonen. i min uvitenhet har jeg levd i den tro at alt i RAID 5 kan gjennopprettes. I stolpe (disk) 2 fra venstre er det øverst en "rød fil" som kun finnes på denne disken. Ut fra denne illustrasjonen er denne filen tapt dersom disk 2 ryker, eller er det noe jeg ikke har fått med meg ?

z_raid5.gif

Lenke til kommentar

En felle man lett kan gå i når det gjelder feiltolerante RAID er å ikke regelmessig sjekke status på RAID'et eller ha en 'Alerter' som sender advarsel når en disk feiler...

 

Så tusler det og går pent med en feilet disk i en tid - og man aner fred og ingen fare - helt til disk nr. 2 ryker...

 

Da sitter man med skjegget fullt av postkasser!!

 

En særdeles ubehagelig situasjon kan jeg skrive under på! Spesielt siden det i utgangspunktet var en grunn til at arrayet skulle være feiltolerant (stikkord: viktige data!)

 

timtowtdi

Lenke til kommentar
Jeg kjører selv RAID5 med 4 SCSI disker på serveren min og må si jeg ble litt "skremt" av denne illustrasjonen. i min uvitenhet har jeg levd i den tro at alt i RAID 5 kan gjennopprettes. I stolpe (disk) 2 fra venstre er det øverst en "rød fil" som kun finnes på denne disken. Ut fra denne illustrasjonen er denne filen tapt dersom disk 2 ryker, eller er det noe jeg ikke har fått med meg ?

z_raid5.gif

Nå har jeg egentlig ganske lite peiling på RAID her, men...

 

Saken er at dersom ikke to disker kræsjer samtidig, vil du ikke miste noe data. Disk 1 inneholder paritetsinformasjon for hele den øverste "blokken", og dersom disk 2 kræsjer, kan dette brukes til å bygge opp dataene på nytt.

 

Hvis vi forenkler litt og sier at hver "blokk" består av 6 bits, og rød fil er 2 bit (1 1) og blå fil er 7 bit (disk 2: 0 0 1 1 , disk 3: 0 1 1) blir det fordelt slik (| markerer skifte av fil)

 

Disk 2: 1 1|0 0 1 1

Disk 3: 0 1 1|0 0 1

Disk 4: 1 1 0 0 0 1

 

Disk 1: paritet (om summen er oddetall: 1, ellers 0)

 

Disk 1: 0 1 1 0 1 1

 

Dersom disk 2 går til helvete, sitter en igjen med følgende data:

 

Disk 1: 0 1 1 0 1 1

Disk 3: 0 1 1|0 0 1

Disk 4: 1 1 0 0 0 1

 

Her kan en regne ut hva som skal være på disk 2 ved å finne ut om [disk1] - [disk3] - [disk4] er partall ([disk2]=0) eller oddetall ([disk2]=1)

 

Altså, bit for bit:

 

0 - 0 - 1 = -1 --> 1

1 - 1 - 1 = -1 --> 1

1 - 1 - 0 = 0 --> 0

0 - 0 - 0 = 0 --> 0

1 - 0 - 0 = 1 --> 1

1 - 1 - 1 = -1 --> 1

 

 

Disk 2: 1 1 0 0 1 1

 

 

Sikkert ræva forklart, men.... :-)

Lenke til kommentar
Nå har jeg egentlig ganske lite peiling på RAID her, men...

Virker ihvertfall som du er på god vei til å få det. :thumbup:

 

 

Don't worry

 

Paritetsinformasjonen (som ligger på disk 1 i "rød fil" eksempelet) baserer seg på data fra disk 2, 3 og 4, selv om den aktuelle filen finnes kun på disk 2.

 

Trenger tydligvis ikke bekymre meg medmindre mer enn en disk kræsjer

Endret av el-asso
Lenke til kommentar
  • 3 uker senere...
Det heter å sitte med skjegget i postkassen. ;)

Stemmer bra det - "skjegget fullt av postkasser" var et forsøk på en humoristisk vri fra min side av det nokså vanlige og etterhvert litt forslitte uttrykket "skjegget i postkassen".

 

Håper hermed at eventuelle misforståelser er oppklart.

 

timtowtdi

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...