Gå til innhold

Power7 tar RISC videre


Anbefalte innlegg

Videoannonse
Annonse
Nå har jeg lest i røkk og napp om disse pcycho prosessorene, hva er det egentlig med dem?, er dem spesielt einet for noe eller er det den ultimate drømmen for alle dataeiere?

 

Men utenom det, hvordan skal en 6,4 GHz 8 kjerner avkjøles!??

Det er vel planlagt noe ekstremt da... (eller?)

Jeg er ikke noen ekspert på prosessorarkitektur, men RISC-basert arkitektur oppererer på en litt forskjellig måte enn x86 eller x64.

Slik jeg oppfatter det er en av grunnene til at de klarer så høy frekvens bruk av flere og kortere pipelines, og en organisering av disse for å tillate høyere frekvens.

Effekten av disse er nokk også en del høyere enn de fleste x86-64 har pr cm², men kjøling er nokk lettere siden de brukes i cluster og supercomputer oppsett.

Lenke til kommentar

Power serien har tradisjonelt hatt fokus på skalerbarhet gjennom høy ytelse per tråd og avansert cache coherency protokoll sammen med slegge metoden for inter-CPU båndbredde. Power6 har vel 30 ganger høyere båndbredde enn Itanium per sokkel...

 

Med Power6 gikk fokus for kjernedesign litt over til throughput heller enn responstid ved at en implementerte en in-order pipeline, riktignok med svært høy frekvens for å holde opp ytelse per tråd. Jeg tror ikke dette passet IBM sine kunder så veldig godt. Hvis de skal kjøpe throughput så kjøper de heller klynger av x64 maskiner.

 

Derfor er Power7 kommet tilbake til Out-of-order design filosofien som skal gi høyere ytelse per tråd og dermed bedre responstider på vanskelige workloads. Det er vel foreløpig ukjent hvor aggressiv OoO designet er. Ut fra de høye throughput tallene kan en spekulere i at den er relativt lite aggressiv siden det er fundamentalt vanskelig å få i både pose og sekk i dette tilfellet, dvs høy teoretisk (PEAK) flertrådet ytelse kombinert med høy ytelse per tråd. For høy reell flertrådet ytelse er ofte høy ytelse per tråd en forutsetning pga Amdahls lov.

 

Når det gjelder forskjellen på RISC og x64 som er CISC-ish, men etterhvert ganske lik RISC, så er det vel helst det at RISC pipelines har 20 år mindre med gamle synder å rette opp i som er forskjellen. Dette slår ut i en enklere decode del som gjør aksess til cache raskere. Decode vil også være mindre energikrevende på RISC. Utover det så er det lite med forskjeller lengre bakover i pipelinen. Hovedforskjellene er at en har noe færre registre å ta av på x64, dette reduserer parallelliteten, samt at en må prøve å håndtere den høyere forsinkelsen i decode slik at den ikke lager for mye bobler når koden hopper til en uforutsett adresse.

 

For Itanium (EPIC) er det en ganske annerledes, og lang, historie.. Det er mulig å få noe ut av linken i signaturen, men det er kanskje litt tørt og teknisk...

 

Hovedpoenget med EPIC er at kompilatoren skal kommunisere parallellitet til CPU slik at den kan implementeres med en kort og enkel, foreløpig in-order, pipeline og samtidig oppnå høy ytelse per tråd. For flertrådet ytelse er det ingen grunnleggende fordeler for EPIC fremfor RISC eller CISC så lenge skalering ikke er et problem. Når skalering blir et problem så blir ytelse per tråd viktig og dermed blir EPIC viktig.

 

Forøvrig kan mange av forskjellene mellom Power og Itanium på en side og x64 på den andre forklares med markedet de selges i. På Power serien har det vært prosessorer på over 500W, hvilket er uaktuelt på en desktop, men OK på en server som står i et datarom til mange millioner kroner med svinaktig dyre kjøleløsninger både i serveren og rommet.

Endret av Anders Jensen
Lenke til kommentar
Nå har jeg lest i røkk og napp om disse pcycho prosessorene, hva er det egentlig med dem?, er dem spesielt einet for noe eller er det den ultimate drømmen for alle dataeiere?

 

Men utenom det, hvordan skal en 6,4 GHz 8 kjerner avkjøles!??

Det er vel planlagt noe ekstremt da... (eller?)

 

Du kan ikke ha lest mye, altså. Det er vist en GOD del ting du har missforstått så.

Prosessoren brukes til HPC. Dette er da gjerne servere som driver med mye kalkulasjoner, og flerfoldige arbeidsoppgaver samtidig. Hva dette kan være er tusen forskjellige ting.

Men en ting er sikkert, det er at disse CPU-ene ikke vil vise mye igjen som en desktop CPU.

 

Du tenker vist at de er på 6.4GHz. Det var nok en stor missforstålese.

Det er ikke så vanlig å måle hastighet gjennom frekvens på slike prosessorer.

Det er kun vanlig å gjøre det slik på desktop CPU'er (x86 -64), i og med at dette er noen frekvens slukende monstere.

Så altså.. 6.4GHz er den maksimale minnefrekvensen CPU'en "godskjenner". Det har INGEN ting med frekvens hastigheten til CPU'en å gjøre. Frekvenshastigheten er jeg usikker på men er trolig godt under 3GHz. Grunnet at høy frekvens er ubetydelig for HPC.

Der gjelder iallefall denne "Kvantiteten er viktigere en kvaliteten" eller hva enn det het :p

Lenke til kommentar

Spent på single-core ytelsen. Den var vel rundt 50% opp fra P5 til P6. Litt i tvil om de klarer å øke tilsvarende nå.

 

Og litt spent på om de klarer å hoste opp en server som i pris/ytelse kan konkurrere med T2-serverne til Sun når det gjelder mangetrådede applikasjoner. IBM må i tilfelle gjøre et strategisk valg på om de vil inn i markedet hvor x86 foreløpig regjerer.

Lenke til kommentar
Det er relativt sjelden at Power# serien benyttes til HPC, den er mer vanlig til virtualisering, databaser og andre workloads hvor en nyter godt av scale up. Til HPC er scale out ofte godt nok og en benytter derfor klynger av 2-veis x64 servere som er billigst per FLOPS.

 

Frekvensen på Power7 blir antagelig rundt 4GHz.

 

Spørs hva du mener med relativt sjelden. Power er iht siste top500.org (de 500 kraftigste HPC-systemene i verden) 11% av systemene. Både PowerXCell (RoadRunner) og BlueGene og de mer general-purpose pSeries-systemene er Power arkitektur. Dvs at Power-arkitektur innehar 1,3,5,7,9 blant de 10 første plassene. RR og BG er mer spesialiserte maskiner som fokuserer på høy flyttallsytelse med relativt svake, massivt antall parallelle enheter. Dette gir god uttelling på Linpack-testen som er utvalgskriterium i top500. pSeries har tyngre SMP-noder, med ekstrem minnebåndbredde, diskoverføringskapasitet (med GPFS filsystem) og alle-til-alle message-passing ytelse over alle nodene i systemet. Dette gir ikke god uttelling på top500, men gir veldig god applikasjonsytelse innenfor et bredt spekter av tradisjonelle HPC-anvendelser. Bl.a. kjører produksjonsmodellene for værvarsling i Norge, England og det Europeiske værsenteret (ECMWF) alle på pSeries.

 

Nå har IBM den senere tid vært under kraftig press bl.a. fra Cray XT-serie og NEC SX-serie (i Europa) den senere tid. Så får vi som er fluer på veggen se i hvilken grad IBM klarer å svare med Power7.

Lenke til kommentar

RoadRunner og Bluegene benytter ikke Power5 eller 6 CPU de benytter en helt annen mikroarkitektur med "likt" ISA. Power 5 og 6 er relativt uegnet til HPC fordi de er for dyre å produsere og har for lav ytelse/watt. De er imidlertid kraftig nok i massevis, men til en uakseptabel kost for de fleste HPC applikasjoner.

 

pSeries er relativt sjelden benyttet til HPC for å være mer konkret, og utelukkende til vanskelige workloads.

 

Ser også veldig frem til å se hva IBM kan levere med Power7. Det blir i alle fall mange tråder per system image. Den største jokeren er likevel Intel. De har utrolig mye HPC potensial de ikke fullt har fått dreis på enda. Tenker da spesielt på FB-DIMM minnekontrollere til high end CPU seriene sine, samt Itanium.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...