Gå til innhold

Ett skritt nærmere "Cell"


Anbefalte innlegg

http://www.gamespot.com/news/2004/11/29/news_6114033.html

 

In the future, the companies expect that a one-rack Cell-based workstation will reach a performance of 16 teraflops of floating point calculations per second.

 

16 teraflops høres ganske mye ut. Noen som vet omtrent hvor mange flops en vanlig desktop-prosessor yter i dag, så vi har noe å sammenligne med?

 

EDIT:

 

CELL is designed to operate as a massively parallel processor, specifically designed for handling graphics and communication-intensive tasks. The chip is engineered to operate in multi-processor environments, and it's expected that the PlayStation 3 will be powered by as many as eight of the devices. It will have the ability to do north of 1 trillion mathematical calculations per second, roughly 100 times more than a single Pentium 4 chip running at 2.5GHz.

 

IBM and Sony also plan to ship CELL workstations and servers aimed at the creative industries, which would feature more of the processors, and would potentially be upgradeable simply by adding "blades" with more processors on them.

 

 

 

PS3 med 8 parallelle "devices"? Vil det ikke bli forferdelig mye mer tungvindt å programmere spillene da? Multiprosessorer har jo aldri vært noen sukess i konsoller tidligere...Tenker på Sega Saturn, Atari Jaguar etc. som alle var et helvete å utnytte kapasiteten til for programmererne og ble straks fiaskoprosjekter...

Endret av kilik
Lenke til kommentar
Videoannonse
Annonse

Litt mer info om "Cell" her:

 

IBM project puts supercomputer on a chip

Code-named the "Cell" chip, it has been in development by IBM, Sony and Toshiba since 2001 for Sony's next-generation video gaming console. But the chip also has been designed with a grander purpose -- to become a core chip for devices ranging from supercomputers to network servers.

 

"We have a supercomputer on a chip," said Jim Kahle, an IBM Fellow who heads up the design team of 400 engineers at IBM's facilities in Austin. "This will be significantly faster than previous types of game systems and should provide new effects."

[...]

Kahle said IBM will not divulge any information about the chip's performance. But he did tout the speed of a prototype workstation, which is designed around the Cell chip. IBM said a Cell-based workstation will reach a supercomputer-like performance of 16 teraflops, or trillions of floating point calculations per second. By contrast, one of the fastest supercomputers in the world, the NEC Earth Simulator, hit a peak speed of 36 teraflops this year.

 

"We are talking about some very intense compute systems that will be on par with some of the fastest in the world when we start rolling these out," Kahle said.

 

IBM also confirmed the Cell chip will have a number of processors on one chip. Although the company will not reveal the number of processors on each chip, analysts expect there will be at least four.

 

The design combines the core of IBM's PowerPC processor with another processor core that is capable of massive floating point processing.

Kanskje vi først som sist skal omdøpe den til "Itanium killer" ? :p

Endret av snorreh
Lenke til kommentar
http://www.gamespot.com/news/2004/11/29/news_6114033.html

 

In the future, the companies expect that a one-rack Cell-based workstation will reach a performance of 16 teraflops of floating point calculations per second.

 

16 teraflops høres ganske mye ut. Noen som vet omtrent hvor mange flops en vanlig desktop-prosessor yter i dag, så vi har noe å sammenligne med?

 

EDIT:

 

CELL is designed to operate as a massively parallel processor, specifically designed for handling graphics and communication-intensive tasks. The chip is engineered to operate in multi-processor environments, and it's expected that the PlayStation 3 will be powered by as many as eight of the devices. It will have the ability to do north of 1 trillion mathematical calculations per second, roughly 100 times more than a single Pentium 4 chip running at 2.5GHz.

 

IBM and Sony also plan to ship CELL workstations and servers aimed at the creative industries, which would feature more of the processors, and would potentially be upgradeable simply by adding "blades" with more processors on them.

 

 

 

PS3 med 8 parallelle "devices"? Vil det ikke bli forferdelig mye mer tungvindt å programmere spillene da? Multiprosessorer har jo aldri vært noen sukess i konsoller tidligere...Tenker på Sega Saturn, Atari Jaguar etc. som alle var et helvete å utnytte kapasiteten til for programmererne og ble straks fiaskoprosjekter...

Vel min AMD Athlon 64 3200+ @ 2.5GHz klarer ca. 4000 mflops ;)

Så vi kan vel si at Cell gruser den ganske enkelt...

Men 16 tera flops er nok reservert for servere med flere cell cpu's sammen går jeg utifra, men en Cell med 8 kjerner sparker nok ganske bra.. ryktet sier vel ca. 1 tera flop :cool:

Definitivt ingen flop(p) med andre ord... :w00t: (hehe bare måtte)

Endret av fluke2k
Lenke til kommentar

Tror Cell vil få problem mot Xbox 2 hvis de ikke har en vpu/gpu som er ihvertfall halvparten så bra som ati r520 kommer til å bli.

Hvis vi tenker at en sekvens i et xbox 2 spill har et shader program på over tusen instruksjoner (kanskje flere tusen også ? 65536 er max i SM3.0) så må det en ganske rå cpu til for å rendre noe sånt hvis man ikke kan ta det på gpu på en eller annet måte.

Husk at det meste avanserte shader programmet i Half-life 2 og Far Cry er rett under 100 instruksjoner "bare".

I min meining er gpu/vpu like viktig og kanskje litt viktigere i en gamer pc eller spill konsoll. Og jeg har ikke hørt mye om det i playstation 3. De kommer til å tape på det i det lange løp når xbox2 spill begynner å få shader program som er på flere tusen instruksjoner.

Lenke til kommentar
Kanskje vi først som sist skal omdøpe den til "Itanium killer" ? :p

Om Cell makter å skyve Itanium ut av markedet så skal den ha all ære for det. Dette er svært spennend teknologi og det er denne typen teknologi som trengs for at utviklingen skal fortsette slik den gjore frem til ca 2000. Tror imidlertid ytelseskarakteristikken til Cell og Itanium er så forskjellige at de ikke vil utgjøre nevneverdig trussel mot hverandre. Itanium er mer fokusert mot kraftig ytelse per tråd. Cell ser ut til å fokusere mer mot throughput slik som Niagara, men Cell fokuserer mer på FP enn branch og integer kode. Det kan også tenkes at fremtidige Itanium og for den saks skyld x86 design vil ta opp i seg egenskaper fra Cell. Slik jeg forstår det så er det ikke instruksjonssettet som er hovedsaken her, men måten å bygge kjerner samt hvordan en kobler dem sammen. De bruker jo tross alt PPC kjerner så det må vel være mulig å bruke andre typer kjerner også.

 

For eksempel har det vært skriverier om interchip kommunikasjon på 6.4Gbps utviklet av Rambus for disse Cell prosessorene. Rambus er vel delvis eid av Intel og seriell FSB samt CPA (Common Platform Architecture) er nærliggende assosiasjoner. Det kan vel tyde på at Tukvila kan bli Cell versjonen av Itanium...

 

Jeg tror nok x86 legger seg flat for Cell lenge før Itanium, og det hadde egentlig vært greit. Det ser ut som om PPC basert Cell vil kunne både utfordre og utfylle Itanium på en rekke områder, mens x86 blir for svak til å utfordre Itanium på ytelse/tråd og for klumpete (små x86 kjerner blir likevell store i forhold til PPC) til å utfordre Cell på throughput. Da er en vel nådd målet! Bli kvitt det gamle skrotet (on offence) som x86 strengt tatt er.

Lenke til kommentar
Ganske spennende, lurer litt på hvordan implementeringen blir i pc-markedet? Kompatibilitet med x86 og 32/64 bits software (linux / Windows / unix)?

Tror du bare kan glemme x64 og i386 støtte i hardware fra den kanten. (heldigvis) Blir nok emulering gjennom software i så fall...

Om den virkelig er 10 ganger raskere, så burde jo software-emulering gå ganske greit. Men som jeg sa i den andre tråden, jeg tror det ikke før jeg får se det.

 

AtW

Lenke til kommentar
Blir automatisk litt skeptisk når de annonserer "10 ganger så kraftig som tilsvarende prosessorer". Tilsvarende på hvilket vis? Og 10 ganger kraftigere i hvilken (spesialtilpasset?) test?
"Cell" skal være 10 ganger så kraftig som tilsvarende prosessorer. Brikken vil bestå av flere kjerner som alle har sine oppgaver. Nettverksegenskapene skal være svært gode.

 

Joda, jeg blir skeptisk jeg også. Trolig er det sammenlignet med CPU'ene i dagens spillkonsoller. Når jeg leser det siterte avsnittet i artikkelen så kan man fort spekulere i om det blir en CPU+GPU+Nettverkskontroller i en brikke. Da blir det jo enkelt å komme med løse påstander om at denne f.eks prosesserer grafikk 10 ganger raskere enn dagens CPU'er. Forklaringen ligger jo selvfølgelig i at dagens CPU'er ikke prosesserer grafikk man overlater arbeidet til en GPU. GPU'er er jo som kjent en svært spesialisert DSP som yter ekstremt mye bedre enn en CPU til helt bestemte oppgaver (grafikk).

 

Trolig kan Cell kobles sammen til en svært billig og kraftig cluster til helt bestemte oppgaver innen lett parallelliserbar grafikk og FEM-modellering.

Endret av Simen1
Lenke til kommentar
Bli kvitt det gamle skrotet (no offence) som x86 strengt tatt er.

hehe.. Kunne ikke vært mere enig;) På tide å tenke nytt...

x86 har overrasket mange før mht. holdbarhet og oppfinnsomhet og med AMD64 så tror jeg denne arkitekturen har en lysende fremtid. Vedrørende "skrot", så er ikke Power-arkitekturen særlig ryddig den heller bare så det er sagt, men så bærer også de fleste arkitekturer i dag på en del "bagasje" uansett.

 

Det som slår meg med "Cell" er at idéene bak den til forveksling ligner mye på konseptene bak INMOS Transputer fra 80-tallet:

http://en.wikipedia.org/wiki/Transputer

Endret av snorreh
Lenke til kommentar

Jo mer jeg leser om Cell jo mer minner det om en FP orientert versjon av Niagara. Verken mer eller mindre. Selvsagt implementeres den med større minnebåndbredde, men det er bare en naturlig konsekvens av å lage et FP orientert design. Vel vel litt skuffet, men ikke mye. Throughput design slik som Cell og Niagara har fordeler i mange segmenter. Typiske ankepunkter mot denne typen design er at de litt for spesialiserte og vanskelige å programere for. Det er forsåvidt riktig, men nisjene de er spesialisert mot er typisk store nok til at en fint kan overleve der. Det er også så godt som umulig å matche ytelsen med et typisk alround design som f.eks "fete" superscalare design (alle vanlige CPUer i dag) innen disse nisjene.

 

Den optimale computer, om noe slikt noen gang blir lagd, vil nok inneholde prosessor ressurser som minner om Cell og Niagara for å effektivt kunne håndtere lett parallelliserbar kode. Vektor prosessorer er en annen resurs som er svært effektiv på enkelte typer kode. SGIs Project Ultraviolet er en grei plass å begynne om en ønsker å sette seg inn i hva slags ressurser som er best egnet til forskjellige oppgaver. Hypercomputer er et annet tema en kan ta en titt på om en er nyskjerrig på dette. I det heletatt er det veldig mange der ute som jobber med spesielle design som er tilpasset spesielle problemtyper, men det er først når alt smeltes sammen og automatisk administreres av OS og kompilator at det blir spennende. Jeg tror vi kommer til å se mange "sære" design om Niagara og Cell innen slutten av dette tiåret fordi det er så mye å hente på det ytelsesmessig.

Lenke til kommentar
Av det jeg har sett i dag så synes jeg ikke Cell ser ut til å egne seg nevneverdig som server. Den ser ut som om arkitekturen er rettet mot på en slags TLP og ekstrem throughput FP ytelse. Det egner seg nesten utelukkende til media bearbeiding. Realtime 3D rendering f.eks. Det ser jo nesten ut som om dette er en konvergering mellom gpu og cpu. Eller hva?

Enig med deg der, Cell virker ikke som det du kjører en database eller web server på. For superdatamaskiner tror jeg den vil egne seg bedre siden du da kan bruke de innebygde vektor prosessorene til tungregning.

Noen har tenkt på at du kan bruke et pci ekpress sjermkort til dette også.

 

Når det gjelder grafikk er jeg litt mer skeptisk om det er lurt å integrere gpu og cpu. Er ingen ekspert på dette men det virker på meg som at fordelignen av arbeidet i en pc er at, GPU rendrer. CPU gjør AI rutiner, oppbygning av 3D modeller, samt alt det andre og sender instruksjoner til GPU som kun rendrer.

 

Båndbredden mellom CPU og GPU er ikke så kritisk, AGP 4 er nok for nesten alt.

Ulempen med et integrert system er at de to prosessorene må dele ram access mellom seg og en GPU har behov for høy båndbredde mot ram, .

 

Fordelen med å integrere disse må være at du kan bruke CPU for en del grafikk oppgaver og bruke vektor prosessorene til beregninger, samt at du sparer penger og resurser.

Lenke til kommentar
Trolig kan Cell kobles sammen til en svært billig og kraftig cluster til helt bestemte oppgaver innen lett parallelliserbar grafikk og FEM-modellering.

Fra det jeg leste om Cell for noen år siden, var det ikke bare grafikk og FEM som stod på programmet, det var heller om å sette sammen et antall Cell-prosessorer til nærmest hva som helst, CPU, GPU, SCSI-kontroller med mer, slik som enkle celler bygger opp kompliserte organer i biologien. Noe slikt kunne en oppnå allerede for flere år siden ved å plassere FPGA-brikker på strategiske steder på et hovedkort, selv om det ikke er støtte for slikt i vanlige OS.

 

Det som var mer uklart var hvorvidt arkitekturen kunne endres dynamisk.

Lenke til kommentar
  • 1 måned senere...
Spesielt denne artikkelen bør være av interesse:

 

Cell Architecture Explained

 

:thumbup:

Jeg vet dette er litt teit argumentasjon, men jeg er litt skeptiksk til den artikkelen, nettopp fordi den forer opp om cell-hypen, som jeg mistenker er sterkt overdrevet, kasnkje er den mye raskere på enkelte spesialiserte oppgaver, ala en GPU, men noe annet enn det tror jeg ikke før jeg får se.

 

AtW

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...