Gå til innhold

Radeon Fury Tråden


Gjest bruker-293283

Anbefalte innlegg

Videoannonse
Annonse

Yter bra i 1440p etter det jeg har testet. Dog ikkje bra nok (enda), mangler 3-400 mhz så kan det bli bra.

Spøker nok for noe særlig overklokking av Fury:

 

From what I am hearing this morning, to put it simply, is not to expect much overclocking at all on the Fury GPUs as those stand right now. It seems as if even getting a small 20MHz clock bump is not panning out on many pieces of Fury silicon.

Kyle Bennett, HardOCP Editor-in-Chief

Lenke til kommentar

Hvorfor yter Fury-korta så svakt på 1080p? Først når man skrur opp innstillingene at de sparker litt ifra seg.

AMD har ikke like gode CPU-optimaliseringer i driveren sin som Nvidia, og disse GPUene er så kraftige at Intels toppmodeller er en flaskehals under 1440p.

 

Det er et greit kort til 500 kr høyere enn 980, men det kommer ikke til å vinne AMD store markedsandeler...

Det som er helt åpenbart ut fra denne testen er at AMD har gitt Fiji for mange ALUer og TMUer i forhold til front- og back-end i kortet: bare 10% raskere enn 390X til tross for over 20% høyere teoretisk regnekraft og over 50% mer minnebåndbredde er ganske dårlig skalering.

Lenke til kommentar

Hvorfor yter Fury-korta så svakt på 1080p? Først når man skrur opp innstillingene at de sparker litt ifra seg.

 

Fordi antallet triangler som skal rendres ikke forandres når man øker oppløsningen, men antallet piksler gjør det.

 

Det er her de forskjellige strategiene til AMD og nVidia kommer til "syne". AMD har mer teoretisk regnekraft, men mangler ROPs til å matche nVidia, slik at når oppløsningen øker så vil droppene til nVidia være større enn for AMD.

Lenke til kommentar

 

Det er et greit kort til 500 kr høyere enn 980, men det kommer ikke til å vinne AMD store markedsandeler...

Det som er helt åpenbart ut fra denne testen er at AMD har gitt Fiji for mange ALUer og TMUer i forhold til front- og back-end i kortet: bare 10% raskere enn 390X til tross for over 20% høyere teoretisk regnekraft og over 50% mer minnebåndbredde er ganske dårlig skalering.

 

Problemet er som du sier, det koster ca. 500 kroner mer en prisen Nvidia har satt for et stock GTX 980 kort, og da havner du på samme pris som fabrikkoverklokka GTX 980 kort og disse kortene har bedre ytelse en Fury.

Men, Fury er et bra produkt. Hadde AMD satt ned prisen med 500 kroner (til samme pris som GTX 980) så hadde det vært et enda bedre produkt.

 

 

Hvorfor yter Fury-korta så svakt på 1080p? Først når man skrur opp innstillingene at de sparker litt ifra seg.

Fordi antallet triangler som skal rendres ikke forandres når man øker oppløsningen, men antallet piksler gjør det.

 

Det er her de forskjellige strategiene til AMD og nVidia kommer til "syne". AMD har mer teoretisk regnekraft, men mangler ROPs til å matche nVidia, slik at når oppløsningen øker så vil droppene til nVidia være større enn for AMD.

 

Teoretisk regnekraft er nøkkelordet. I GPGPU så er problemet at du må ha spesielle typer arbeidslaster for å kunne utnytte SIMD-arkitekturen i GCN effektivt. Det samme er også et problem med Intel sin Xeon Phi arkitektur, det er vanskelig å hente ut i nærheten av teoretisk ytelse hvis ikke du har en arbedslast som passer veldig godt til arkitekturen.

 

AMD sin styrke frem til Maxwell var at arkitekturen hadde flere globale schedulere enn både Kepler og Fermi, slik at du kunne lettere dispatche flere forskjellige kernels, men Nvidia gjorde store endringer med Maxwell har. Det andre problemet med AMD sin compute arkitektur er minne og cache hierarkiet, det er lite fleksibelt sammenlignet med Nvidia sin arkitektur.

 

I mine øyne så trenger GCN en "major redesign", det har kun vært patchet lit på siden arkitekturen ble lansert i 2011. Dessverre kommer ikke dette til å skje med det første, da AMD også utvikler to andre arkitekturer fra "scartch", høyest prioriter har Zen (x86) den bør fremdeles kunne dukke opp mot slutten av 2016. Neste er K12 (ARMv8) der sier de for øyeblikket medio 2017.

Lenke til kommentar

Fordi antallet triangler som skal rendres ikke forandres når man øker oppløsningen, men antallet piksler gjør det.

 

Det er her de forskjellige strategiene til AMD og nVidia kommer til "syne". AMD har mer teoretisk regnekraft, men mangler ROPs til å matche nVidia, slik at når oppløsningen øker så vil droppene til nVidia være større enn for AMD.

Vel det handler nok ikke primært om regnekraft eller ROP, men om TMU. Ved høyere oppløsning blir lasten på ROP høyere også, men oftest øker lasten på TMU mer, så over en grense så blir TMU viktigere.
Lenke til kommentar

 

Fordi antallet triangler som skal rendres ikke forandres når man øker oppløsningen, men antallet piksler gjør det.

 

Det er her de forskjellige strategiene til AMD og nVidia kommer til "syne". AMD har mer teoretisk regnekraft, men mangler ROPs til å matche nVidia, slik at når oppløsningen øker så vil droppene til nVidia være større enn for AMD.

Vel det handler nok ikke primært om regnekraft eller ROP, men om TMU. Ved høyere oppløsning blir lasten på ROP høyere også, men oftest øker lasten på TMU mer, så over en grense så blir TMU viktigere.

 

Hadde det vært mangel på teksturenheter burde Nvidia vært truffet hardere enn AMD. Fury X har jo 256 TMUer, og Fury har 224...

Jeg tror det er for mange GCN-kjerner i forhold til hvor mange piksler Fiji er istand til å dytte ut per klokke, både Geometry Engines, Rasterizers, og ROPs burde vært økt med minst 25%, men det er sannsynligvis ikke mulig uten en redesign av GCN...

Lenke til kommentar

Hadde det vært mangel på teksturenheter burde Nvidia vært truffet hardere enn AMD. Fury X har jo 256 TMUer, og Fury har 224...

Jeg tror det er for mange GCN-kjerner i forhold til hvor mange piksler Fiji er istand til å dytte ut per klokke, både Geometry Engines, Rasterizers, og ROPs burde vært økt med minst 25%, men det er sannsynligvis ikke mulig uten en redesign av GCN...

Ja, Fiji har 4 geometry engines og rasterizers som er koblet tett sammen.

Nvidia har en mer distrubiert model (dette var en av utfordringene som forsinket Fermi) og en GM200-brikke har 6 rasterizers og 24 geometry engines.

 

Både GM200 og Fiji er begrenset av maks størrelse som TSMC klarer å lage en 28nm brikke. Derfor har både Nvidia og AMD ofret double precision ytelsen for å få maks single precision ytelse.

  • Liker 1
Lenke til kommentar

 

Hadde det vært mangel på teksturenheter burde Nvidia vært truffet hardere enn AMD. Fury X har jo 256 TMUer, og Fury har 224...

Jeg tror det er for mange GCN-kjerner i forhold til hvor mange piksler Fiji er istand til å dytte ut per klokke, både Geometry Engines, Rasterizers, og ROPs burde vært økt med minst 25%, men det er sannsynligvis ikke mulig uten en redesign av GCN...

Ja, Fiji har 4 geometry engines og rasterizers som er koblet tett sammen.

Nvidia har en mer distrubiert model (dette var en av utfordringene som forsinket Fermi) og en GM200-brikke har 6 rasterizers og 24 geometry engines.

 

Både GM200 og Fiji er begrenset av maks størrelse som TSMC klarer å lage en 28nm brikke. Derfor har både Nvidia og AMD ofret double precision ytelsen for å få maks single precision ytelse.

 

Nice info  :thumbup:

  • Liker 1
Lenke til kommentar

Både GM200 og Fiji er begrenset av maks størrelse som TSMC klarer å lage en 28nm brikke. Derfor har både Nvidia og AMD ofret double precision ytelsen for å få maks single precision ytelse.

Det jeg ikke helt klarer å få til å gå opp:

Fiji har 64 "Compute Units" med 8.9 milliarder transistorer og 1/16 FP64-ytelse, og et 4096 HBM-grensesnitt som ifølge PR skal bruke færre transistorer og mindre strøm.

Grenada/Hawaii har 44 "Compute Units" med 6.2 milliarder transistorer og 1/2 FP64-ytelse, med et 512-bit GDDR5-grensesnitt.

 

64/44 = 1.45

6.2 * 64/44 = 9.018

Med mindre HBM-grensesnittet, fargekomprimeringen, og finere power-gating økte transistorbruken per ROP/TMU/CU betraktelig burde Fiji bestå av vesentlig mer enn 45% flere CUs med kraftig redusert FP64-ytelse. Det gir rett og slett ikke mening, selv ikke Tonga er så ineffektiv i transistorbruken ettersom det er bekreftet at den har egentlig 384-bit minnebuss.

Lenke til kommentar
  • 1 måned senere...

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...