Gå til innhold

Da Itslearning krasjet måtte de fly inn nye komponenter. Opptil 2 millioner brukere rammet


Gjest Marius B. Jørgenrud

Anbefalte innlegg

Videoannonse
Annonse

Var det Compellent SAN som gikk dukken? Hva røyk i så fall? Var det spenningspeak som gjorde at PSU i begge SAN gikk åt skogen? Skal vel litt til at andre typer like deler ryker samtidig. Noen som sitter på info?

 

-Sikkert en klapphatt som har satt begge SAN på samme krets med undersimensjonert sikringsboks. -Spare penger vettu. El-nettet er et anna budsjett. -Må se de stikkdåsene de bruker for å komme hele veien ned til computern nederst i hjørnet. -Hvor det i øvrig står en kaffetrakter og mikrobølgeovn i samme stikkdåse. ??

  • Liker 2
Lenke til kommentar

Ganske utrolig at to SAN ryker sammtidig. Har enda ikke skjedd i min datakariere på 20 år.

 

Det er ganske utrolig at noen vinner i viking lotto også.

Til tross for det, så skjer det nærmest ukentlig.

Sier ikke at det skjedde i den sammenhengen her, men det kan være greit å ha i bakhodet at det skjer usannsynlige ting rundt oss hele tiden.

  • Liker 3
Lenke til kommentar

Minner litt om det som skjedde for 6 mnd siden i bedriften jeg jobber for. Rapporten fra hosting lev. fortalte at deres to forskjellige Dell SAN gikk ned samtidig pga hardware feil, alle VM ble utilgjengelige. De jobbet tett med Dell og fikk dem opp etter noen dager, undrer på om dette kan skyldes det samme?

  • Liker 2
Lenke til kommentar

SAN løsninger med auto-tiering som del Compellent kan fort gå ned når workload endres vesentlig. Dette kan forekomme hvis en får mye aksess mot type NL-SAS disker. Da blir det så stor missmatch mellom behov og kapasitet at systemet i praksis er nede. Dette har jeg selv erfart med Compellent, men er nok likt for andre auto-tiered systemer. Det er rett og slett en tradeoff i designet, eller en feil kapasitets konfigurasjon om en vil. Uansett en kalkulert risiko ved auto-tiering. Har også sett DAS løsninger med NL-SAS disker (ikke Dell) som har fått vesentlig økning i diskfeil når workload brått hopper opp. Dette er nok et generelt problem med NL-SAS disker som har stått på lav last noe tid.

Lenke til kommentar

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

 

Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?

Har du noen kundereferanser som bruker Ceph?

  • Liker 1
Lenke til kommentar

Ja, alle løsninger som bruker failover sliter trolig med en haug med andre problemer. Split brain er en av de vanlige. Ceph bruker paxos for konsensus og er skikkelig bygd opp for å kunne lastbalansere io og håntere feil. Ceph er det big shit innenfor storage idag, Cern av de største som bruker det.

Endret av siDDis
Lenke til kommentar

 

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?

Har du noen kundereferanser som bruker Ceph?

Vel hvis du har oppdaget GIFEE/CNCF verdenen så er alt av SAN søppel. Mangler distribuert konsensus, utgått paradigme. Kan si det samme om alle enterprise systemer og appliances. Distribuert konsensus, roboter og deklarativ konfigurasjon er det som gjelder fremover. Sjekk ut apache kudu, cockroachDB, seesaw V2, kubernetes, openshift, ceph, prometheus+++
Lenke til kommentar

 

 

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?

Har du noen kundereferanser som bruker Ceph?

Vel hvis du har oppdaget GIFEE/CNCF verdenen så er alt av SAN søppel. Mangler distribuert konsensus, utgått paradigme. Kan si det samme om alle enterprise systemer og appliances. Distribuert konsensus, roboter og deklarativ konfigurasjon er det som gjelder fremover. Sjekk ut apache kudu, cockroachDB, seesaw V2, kubernetes, openshift, ceph, prometheus+++

Kubernetes er kult det, ikke mange kunder i Norge som strengt tatt er trenger dette. Hashicorp har en enklere variant, Nomad, dog testet med 5000+ noder istedenfor 1000+. Openshift / softlayer etc. er og spennende teknologi. Redhat på en og IBM på den andre.

 

Ceph ser og kult ut, v1.0 kom 21 April 2016?

 

Kudu har vel egentlig 1 kundereferanse i produksjon, i Japan? Kudu har heller ingen offisiell kursing på plass. Seesaw og cockroach kjenner jeg ikke, skal sjekkes ut.

 

Mye nytt her. Lite kompetanse, tar nok litt tid før dette er commodity? For all del, liker listen. Tar nok litt tid før det er utbredt.

 

Hashicorp vault kan en og sjekke ut. Samt Fabric8.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...