Gå til innhold

AMD med 48-kjerners tallknuser


Anbefalte innlegg

Videoannonse
Annonse

Er det ekte 32bit FP i ATI sin GPU? Jeg blir ikke mye forundret om de fleste/alle dagens GPUer jukser litt med de minst signifikante bitene. Det er ganske mye ytelse, effekt og areal og spare på dette uten at biledkvaliteten blir nevneverdig påvirket. Uansett vet jeg at det ikke er snakk om IEEE 754 kompatibel SP FP aritmetikk, så det kan fort bli store forskjeller på teoretisk og praktisk ytelse om en må drive å sjekke for overflow i software.

Endret av Anders Jensen
Lenke til kommentar
Er det ekte 32bit FP i ATI sin GPU? Jeg blir ikke mye forundret om de fleste/alle dagens GPUer jukser litt med de minst signifikante bitene. Det er ganske mye ytelse, effekt og areal og spare på dette uten at biledkvaliteten blir nevneverdig påvirket.  Uansett vet jeg at det ikke er snakk om IEEE 754 kompatibel SP FP aritmetikk, så det kan fort bli store forskjeller på teoretisk og praktisk ytelse om en må drive å sjekke for overflow i software.

7288936[/snapback]

 

Tror ikke det er meningen at dette skal bli brukt til grafikk (...vel kanskje rendring), men til mer "seriøse" oppgaver som DNA-analyser osv.

 

Er nok ikke meningen at hvermansen skal kjøpe dette kortet. Prisen på $2600 dollar tilsier det.

 

Så når det kommer til stykket MÅ nok det være ekte 32bits FP'er det er snakk om. Ellers ville jo dataen være ubrukelig til disse formålene. Eller hur?

Lenke til kommentar
Blir det denne man skal sette rekorder i Superpi med?

7288860[/snapback]

Gjetter på at superPI ikke er rette programmet for å måle den helt store ytelsen. Hvis jeg har forstått det riktig så kjører superPI i kun en tråd (wikipedia om superPI), mens dette kortet har styrken sin i at det kan løse oppgaver i parallell.

 

Jeg mener ikke at vi ikke kan få økt ytelse i superPI, bare at den vil øke mye mer i andre tester. Stemmer det?

Lenke til kommentar
Er det ekte 32bit FP i ATI sin GPU? Jeg blir ikke mye forundret om de fleste/alle dagens GPUer jukser litt med de minst signifikante bitene. Det er ganske mye ytelse, effekt og areal og spare på dette uten at biledkvaliteten blir nevneverdig påvirket.  Uansett vet jeg at det ikke er snakk om IEEE 754 kompatibel SP FP aritmetikk, så det kan fort bli store forskjeller på teoretisk og praktisk ytelse om en må drive å sjekke for overflow i software.

7288936[/snapback]

 

Tror ikke det er meningen at dette skal bli brukt til grafikk (...vel kanskje rendring), men til mer "seriøse" oppgaver som DNA-analyser osv.

 

Er nok ikke meningen at hvermansen skal kjøpe dette kortet. Prisen på $2600 dollar tilsier det.

 

Så når det kommer til stykket MÅ nok det være ekte 32bits FP'er det er snakk om. Ellers ville jo dataen være ubrukelig til disse formålene. Eller hur?

7289269[/snapback]

Vel det var akkurat det jeg lurte på, men det er nok ikke en nødvendighet at en har ekte 32bit for alle typer applikasjoner. Det er mange applikasjoner utover realtime 3D rendering som kan klare seg med mindre enn 32bit FP nøyaktighet, men noen vil selfølgelig bli begrenset av dette og noen applikasjoner krever enda til 64bit FP så de blir jo helt uaktuelle å kjøre på dette kortet. Det er faktisk noen som ønsker seg 128bit FP (quad precision) til sine applikasjoner, men det er nok et fåtall.

Lenke til kommentar
-Hvor rask er forresten verdens 500. raskeste maskin?

7289634[/snapback]

http://www.top500.org/system/7839

 

2,736 TFLOPS sustained 4,896 TFLOPS peak eller ca 14 ganger raskere enn dette kortet, men det er altså 64 bit IEEE745 FP operasjoner ikke 32bit kvasi IEEE754 FP operasjoner så du kan vel øke forspranget med minst 2x.

Endret av Anders Jensen
Lenke til kommentar
Det rapporteres at disse prosessorene har en samlet kraft på 360 gigaflops, noe som er ti-gangeren og vel så det sammenlignet med en x86-dobbelkjerneprosessor.

 

Anders Jensen, hva er egentlig teoretisk og praktisk FP-ytelse på moderne x86-prosessorer? Det er vel ennå en stund før det kommer opp på nivå med 36 Gflops selv på toppmodellene av Kentsfield? Regner man normalt med eller uten SSE?

Lenke til kommentar
http://www.top500.org/system/7839

 

2736.9 TFLOPS sustained 4896 TFLOPS peak eller ca 14 ganger raskere enn dette kortet, men det er altså 64 bit IEEE745 FP operasjoner ikke 32bit kvasi IEEE754  FP operasjoner så du kan vel øke forspranget med minst 2x.

7289836[/snapback]

 

Du har vel ikke blingset på Tera kontra Giga? Verdens superdatamaskiner er nok kraftigere enn som så, det vil si ca 14 000 ganger kjappere enn dette kortet, hvis det er peak du tenker på.

 

EDIT: Og 14000 ganger for en maskin med 800 Xeon prosessorer ble igjen seff veldig mye.. Greia var vel at top500.org oppgir gigaflops, mens du sa Tera, med andre ord er 14 rimelig korrekt, noe som gjør dette kortet relativt kraftig spør du meg, til tross for forskjellen i operasjoner..

 

EDIT2: Trykkleifen var her...

Endret av Wetatron
Lenke til kommentar
Det rapporteres at disse prosessorene har en samlet kraft på 360 gigaflops, noe som er ti-gangeren og vel så det sammenlignet med en x86-dobbelkjerneprosessor.

 

Anders Jensen, hva er egentlig teoretisk og praktisk FP-ytelse på moderne x86-prosessorer? Det er vel ennå en stund før det kommer opp på nivå med 36 Gflops selv på toppmodellene av Kentsfield? Regner man normalt med eller uten SSE?

7290375[/snapback]

Tja jeg har vel fint lite peiling på hva som er praktisk FP ytelse, men den teoretiske er jo noe mindre innfløkt å kalkulere.

 

Tar utgangspunkt i Woodcrest på 3 GHz da den har høyest teoretisk FP ytelse av alle x86 prosessorer. Med to SIMD FP operasjoner per syklus, hver SIMD operasjon med 4 x 32bit (SP) FP ops gir den:

 

8ops/cycle * 3GHz = 24 GFLOPS

 

Altså 24 GFLOPS SP FP per kjerne eller 48 GFLOPS totalt per sokkel. Det er jo sånn sirkum 1/10 av 360GFLOPS ettersom hvordan en ser det.

Lenke til kommentar

Bli med i samtalen

Du kan publisere innhold nå og registrere deg senere. Hvis du har en konto, logg inn nå for å poste med kontoen din.

Gjest
Skriv svar til emnet...

×   Du har limt inn tekst med formatering.   Lim inn uten formatering i stedet

  Du kan kun bruke opp til 75 smilefjes.

×   Lenken din har blitt bygget inn på siden automatisk.   Vis som en ordinær lenke i stedet

×   Tidligere tekst har blitt gjenopprettet.   Tøm tekstverktøy

×   Du kan ikke lime inn bilder direkte. Last opp eller legg inn bilder fra URL.

Laster...
×
×
  • Opprett ny...