Da Itslearning krasjet måtte de fly inn nye komponenter. Opptil 2 millioner brukere rammet

11. oktober 2016

Teknikere har jobbet på spreng gjennom hele natten.

Da Itslearning krasjet måtte de fly inn nye komponenter. Opptil 2 millioner brukere rammet

11. oktober 2016

ITL er noe drit, hadde gjort verden en tjeneste om de lot det ligge og erklærte systemet dødt for godt.

Sandormen · 11. oktober 2016

Var det Windows 10? ?

Mazeking · 11. oktober 2016

Var det Compellent SAN som gikk dukken? Hva røyk i så fall? Var det spenningspeak som gjorde at PSU i begge SAN gikk åt skogen? Skal vel litt til at andre typer like deler ryker samtidig. Noen som sitter på info?

Endret 11. oktober 2016 av Mazeking

Joar Guttormsen · 11. oktober 2016

Ganske utrolig at to SAN ryker sammtidig. Har enda ikke skjedd i min datakariere på 20 år.

Sandormen · 11. oktober 2016

Var det Compellent SAN som gikk dukken? Hva røyk i så fall? Var det spenningspeak som gjorde at PSU i begge SAN gikk åt skogen? Skal vel litt til at andre typer like deler ryker samtidig. Noen som sitter på info?

-Sikkert en klapphatt som har satt begge SAN på samme krets med undersimensjonert sikringsboks. -Spare penger vettu. El-nettet er et anna budsjett. -Må se de stikkdåsene de bruker for å komme hele veien ned til computern nederst i hjørnet. -Hvor det i øvrig står en kaffetrakter og mikrobølgeovn i samme stikkdåse. ??

siDDis · 11. oktober 2016

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

Bjørn Remseth · 11. oktober 2016

Ganske utrolig at to SAN ryker sammtidig. Har enda ikke skjedd i min datakariere på 20 år.

Enig. Sannsynligheten for at det er en felles årsak er veldig nær 1.0

Quote · 11. oktober 2016

Var sikkert en gledelig nyhet for alle studenter der ute som hadde innleveringsfrist ved midnatt.

sk0yern · 11. oktober 2016

Ganske utrolig at to SAN ryker sammtidig. Har enda ikke skjedd i min datakariere på 20 år.

Det er ganske utrolig at noen vinner i viking lotto også.

Til tross for det, så skjer det nærmest ukentlig.

Sier ikke at det skjedde i den sammenhengen her, men det kan være greit å ha i bakhodet at det skjer usannsynlige ting rundt oss hele tiden.

erniebernie · 11. oktober 2016

Minner litt om det som skjedde for 6 mnd siden i bedriften jeg jobber for. Rapporten fra hosting lev. fortalte at deres to forskjellige Dell SAN gikk ned samtidig pga hardware feil, alle VM ble utilgjengelige. De jobbet tett med Dell og fikk dem opp etter noen dager, undrer på om dette kan skyldes det samme?

OI4GT0PV · 11. oktober 2016

Minner litt om det som skjedde for 6 mnd siden i bedriften jeg jobber for.

Var det Compellent SAN?

Anders Jensen · 11. oktober 2016

SAN løsninger med auto-tiering som del Compellent kan fort gå ned når workload endres vesentlig. Dette kan forekomme hvis en får mye aksess mot type NL-SAS disker. Da blir det så stor missmatch mellom behov og kapasitet at systemet i praksis er nede. Dette har jeg selv erfart med Compellent, men er nok likt for andre auto-tiered systemer. Det er rett og slett en tradeoff i designet, eller en feil kapasitets konfigurasjon om en vil. Uansett en kalkulert risiko ved auto-tiering. Har også sett DAS løsninger med NL-SAS disker (ikke Dell) som har fått vesentlig økning i diskfeil når workload brått hopper opp. Dette er nok et generelt problem med NL-SAS disker som har stått på lav last noe tid.

Fungus · 11. oktober 2016

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?

Har du noen kundereferanser som bruker Ceph?

siDDis · 11. oktober 2016

Ja, alle løsninger som bruker failover sliter trolig med en haug med andre problemer. Split brain er en av de vanlige. Ceph bruker paxos for konsensus og er skikkelig bygd opp for å kunne lastbalansere io og håntere feil. Ceph er det big shit innenfor storage idag, Cern av de største som bruker det.

Endret 11. oktober 2016 av siDDis

Anders Jensen · 11. oktober 2016

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.

Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?

Har du noen kundereferanser som bruker Ceph?

Vel hvis du har oppdaget GIFEE/CNCF verdenen så er alt av SAN søppel. Mangler distribuert konsensus, utgått paradigme. Kan si det samme om alle enterprise systemer og appliances. Distribuert konsensus, roboter og deklarativ konfigurasjon er det som gjelder fremover. Sjekk ut apache kudu, cockroachDB, seesaw V2, kubernetes, openshift, ceph, prometheus+++

thorsan · 11. oktober 2016

På tide med skikkelig redundante løsninger som f.eks Ceph? Skal veldig mye til for å dra ned det. Minuset er jo at Ceph koster, då det ikkje er eit verktøy for juniorer. Resten bør helst bruke cloudtenestane til Google eller Amazon.
Så du mener at alle SAN løsninger fra DELL, HP, IBM er skrot, og at kun Ceph duger?
Har du noen kundereferanser som bruker Ceph?

Vel hvis du har oppdaget GIFEE/CNCF verdenen så er alt av SAN søppel. Mangler distribuert konsensus, utgått paradigme. Kan si det samme om alle enterprise systemer og appliances. Distribuert konsensus, roboter og deklarativ konfigurasjon er det som gjelder fremover. Sjekk ut apache kudu, cockroachDB, seesaw V2, kubernetes, openshift, ceph, prometheus+++

Kubernetes er kult det, ikke mange kunder i Norge som strengt tatt er trenger dette. Hashicorp har en enklere variant, Nomad, dog testet med 5000+ noder istedenfor 1000+. Openshift / softlayer etc. er og spennende teknologi. Redhat på en og IBM på den andre.

Ceph ser og kult ut, v1.0 kom 21 April 2016?

Kudu har vel egentlig 1 kundereferanse i produksjon, i Japan? Kudu har heller ingen offisiell kursing på plass. Seesaw og cockroach kjenner jeg ikke, skal sjekkes ut.

Mye nytt her. Lite kompetanse, tar nok litt tid før dette er commodity? For all del, liker listen. Tar nok litt tid før det er utbredt.

Hashicorp vault kan en og sjekke ut. Samt Fabric8.

passionforrelaxing · 11. oktober 2016

nesten synd at de ikke var nede et døgn eller noe

siDDis · 11. oktober 2016

Mye nytt her. Lite kompetanse, tar nok litt tid før dette er commodity? For all del, liker listen. Tar nok litt tid før det er utbredt.

Du har også andre *gamle* alternativer som HDFS eller OpenStack Swift, selv om begge begynner å nærme seg 10 år så trur mange det er heilt nytt...

LP0EJAFD · 12. oktober 2016

Veldig bra de deler det de kan dele av informasjon og på ett så tidlig tidspunkt etter hendelse. Eksempel å følge.

Da Itslearning krasjet måtte de fly inn nye komponenter. Opptil 2 millioner brukere rammet

Anbefalte innlegg

Gjest Marius B. Jørgenrud

Lenke til kommentar

Videoannonse

Gjest Slettet+89234341

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Opprett konto

Logg inn

Populær nå

Hvem er aktive 0 medlemmer