Gå til innhold

AMD Polaris & Vega og midlertidig (?) Navi


ExcaliBuR
Gjest

 

Anbefalte innlegg

Videoannonse
Annonse

Det som også er litt spennende å se er at det ser ut som det har blitt gjort endringer i arkitekturen til Vega siden de var "ferdigstilt" i august i fjor , hva dette vil innebære i form av ytelse eller andre forbedringer blir spennende å se. Amd trenger virkelig et kort som kan konkurrere med Nvidia.

Vega 10 hadde første tap-out i juni 2016.

På det tidspunktet er var planen fra SK Hynix at 4-Hi HBM2 stacks skulle være klare i begynnelsen av Q4 2016 og 8-Hi skulle være klart i begynnelsen av Q1 2017. Da snakker vi om minne sertifisert opp til 2,0 Gbps.

 

Det er ikke gjort endringer på Vega siden tap-out (juni 2016). Tommelfinger-reglen er at en re-spin forsinker en brikke 6 måneder (endringer av metallag og små tweaks, kan typisk gjøres for å forbedre klokkefrekvens og yields). Nytt utlegg av transistorer, som det å legge til ny funksjonalitet er tar forsinker et produkt med rundt 1 år.

 

"Tabben" AMD gjorde denne gangen var et de gikk for en løsning med 2 stk. HBM-stacks isteden for 4 stk. som de brukte på Fury. Dette sparer penger, men krever også raskere HBM2 minne (2,0 Gbps versus 1,6 Gbps) som har vist seg å være forsinket.

 

Nvidia valgte 4 stacks på GP100 og GV100, men dette er produkter med meget høy margin, så BOM (bill of materials) er ikke så viktig.

 

 

Strømforbruk, hvor mye snakker vi spart HBM2 vs GDDR5X?

Ca. 20-25W på GDDR5X versus HBM2 (sammenligning på GP100 versus GP102).

GDDR5X reduserer spenningen fra 1,5V til 1,35V som sparer strøm sammenlignet med GDDR5 minne.

  • Liker 1
Lenke til kommentar

 

Det som også er litt spennende å se er at det ser ut som det har blitt gjort endringer i arkitekturen til Vega siden de var "ferdigstilt" i august i fjor , hva dette vil innebære i form av ytelse eller andre forbedringer blir spennende å se. Amd trenger virkelig et kort som kan konkurrere med Nvidia.

Vega 10 hadde første tap-out i juni 2016.

På det tidspunktet er var planen fra SK Hynix at 4-Hi HBM2 stacks skulle være klare i begynnelsen av Q4 2016 og 8-Hi skulle være klart i begynnelsen av Q1 2017. Da snakker vi om minne sertifisert opp til 2,0 Gbps.

 

Det er ikke gjort endringer på Vega siden tap-out (juni 2016). Tommelfinger-reglen er at en re-spin forsinker en brikke 6 måneder (endringer av metallag og små tweaks, kan typisk gjøres for å forbedre klokkefrekvens og yields). Nytt utlegg av transistorer, som det å legge til ny funksjonalitet er tar forsinker et produkt med rundt 1 år.

 

"Tabben" AMD gjorde denne gangen var et de gikk for en løsning med 2 stk. HBM-stacks isteden for 4 stk. som de brukte på Fury. Dette sparer penger, men krever også raskere HBM2 minne (2,0 Gbps versus 1,6 Gbps) som har vist seg å være forsinket.

 

Jeg mener fortsatt at den største tabben AMD gjorde var å gå for HBM2 med 2 stacks når de kunne fått samme resultat med 512-bit GDDR5 for en brøkdel av utviklings- og produksjonskostnadene. De kunne like godt lagt tiden og pengene de hadde til rådighet for HBM2 inn i å forbedre arkitekturen til Vega ytterliger og/eller legge inn støtte for GDDR5X

  • Liker 1
Lenke til kommentar

 

Strømforbruk, hvor mye snakker vi spart HBM2 vs GDDR5X?

Ca. 20-25W på GDDR5X versus HBM2 (sammenligning på GP100 versus GP102).

GDDR5X reduserer spenningen fra 1,5V til 1,35V som sparer strøm sammenlignet med GDDR5 minne.

 

 

Takker, det er jo ganske så signifikant da ja :)

Lenke til kommentar

Denne artikkelen utdyper litt hvorfor  "High Bandwith Cache" vil være en fordel :
 

 

But it's the High Bandwidth Cache and High Bandwidth Controller silicon which looks the most exciting and that's all related to moving outside of the limits of the graphics card's video memory. In normal GPUs developers have to fit all the data they need to render into the frame buffer, meaning all the polygons, shaders and textures have to squeeze into your card's VRAM.

That can be restrictive and devs have to find clever workarounds for large, open-world games. The revolution with AMD's Vega design is to break free of those limits. The High Bandwidth Cache and High Bandwidth Controller mean the GPU can now stream in rendering data from your PC's system memory or even an SSD, meaning it doesn't have to come via the card's frame buffer.

https://www.pcgamesn.com/amd/amd-vega-gpu-specifications

Endret av 097100106111101
Lenke til kommentar

Hvis man skreller vekk buzzwordene rundt "High Bandwidth Cache" og "High Bandwidth Controller" så er det ikke så veldig revolusjonerende.

 

For det første er du avhengig av å gå tom for VRAM før det har noe for seg. Jeg er ikke så oppdatert på hvor mye VRAM moderne spill krever, men man må vel opp i 4K oppløsning samt ha mindre enn 8 GB for det i det hele tatt er noe problem?

 

Nvidia har en liknende teknologi i alle Pascal GPUer. Det kalles "Unified Memory", foreløpig er det kun CUDA som bruker det, men det er også beta-versjoner av utvidelser for OpenCL og Vulkan. Det fungerer på samme måte som Vega, GPU'en har en "page migration engine". Prøver GPU å aksessere data som enda ikke er i VRAM så generes det en "page fault" og GPU driver vil flytte data over fra hovedminne til GPU-minne. Når VRAM blir full så kaster man ut data som det ikke lenger er behov for.

 

Med "Unified Memory" eller "High Bandwidth Cache" vil man ende opp med at PCI Express vil bli flaskehalsen, nåværende 16 lanes Gen 3 bus har en teoretisk båndbredde på rundt 16 GB/s, i praksis vil den være litt lavere. Gen 4 vil doble dette til neste år.

  • Liker 5
Lenke til kommentar

Hvis man skreller vekk buzzwordene rundt "High Bandwidth Cache" og "High Bandwidth Controller" så er det ikke så veldig revolusjonerende.

 

For det første er du avhengig av å gå tom for VRAM før det har noe for seg. Jeg er ikke så oppdatert på hvor mye VRAM moderne spill krever, men man må vel opp i 4K oppløsning samt ha mindre enn 8 GB for det i det hele tatt er noe problem?

 

Nvidia har en liknende teknologi i alle Pascal GPUer. Det kalles "Unified Memory", foreløpig er det kun CUDA som bruker det, men det er også beta-versjoner av utvidelser for OpenCL og Vulkan. Det fungerer på samme måte som Vega, GPU'en har en "page migration engine". Prøver GPU å aksessere data som enda ikke er i VRAM så generes det en "page fault" og GPU driver vil flytte data over fra hovedminne til GPU-minne. Når VRAM blir full så kaster man ut data som det ikke lenger er behov for.

 

Med "Unified Memory" eller "High Bandwidth Cache" vil man ende opp med at PCI Express vil bli flaskehalsen, nåværende 16 lanes Gen 3 bus har en teoretisk båndbredde på rundt 16 GB/s, i praksis vil den være litt lavere. Gen 4 vil doble dette til neste år.

 

Dette viser vel ganske så godt hva din holdning er, med mindre du faktisk har hatt tilgang til et nyere Vega kort med den  nye teknologien som er på plass.

 

Personlig tror jeg det er like greit å avvente og se hva resultatene blir.

  • Liker 3
Lenke til kommentar

Dette viser vel ganske så godt hva din holdning er, med mindre du faktisk har hatt tilgang til et nyere Vega kort med den  nye teknologien som er på plass.

Så fordi jeg vet hvordan AMD har implementert dette og hvile implikasjoner dette vil ha for ytelse så sier det noe om holdningen min???

 

Ja ja... Jeg får vel heller sluke alt som blir sagt rått da! :D

 

Eller ikke... La oss ta det teknisk.

 

Vi er vel forhåpentligvis begge enige om at det beste scenarioet er at all data vi trenger har plass i VRAM slik det er i dag, er vi ikke?

 

1. AMD var nødt til å kunstig sette VRAM helt ned til 2GB for å kunne vise en særlig effekt på Rise of Tomb Raider.

 

2. En innebygd benchmark slik AMD viste frem er det absolutt beste scenarioet å vise frem en slik paging/caching strategi, fordi du allerede vet hvilken vei demoen beveger seg hele tiden.

Under vanlig spilling er du avhengig av to teknikker, eller en kombinasjon av disse:

 

a) Spillutvikleren legger inn hint i koden om når store objekter høyst sannsynlig ikke trengs lenger, og når det eventuelt er på tide å laste inn nye objekter i VRAM.

 

b) Logikken legges inn i GPU-driver, man bruker også dead reckoning til å "gjette" på hvordan spilleren beveger seg, og ut i fra dette kan man laste inn data i VRAM som man da med høy sannsynlighet ut i fra DR-algoritmen regner med at trengs.

 

Worst case så blir PCI Express flaskehalsen slik det allerede er i dag.

 

Men, når man risikerer å bli sammenlignet med konkurrenten som har 11GB og 12GB så er det selvsagt bra å ha noen buzzword! :)

Endret av HKS
  • Liker 5
Lenke til kommentar

 

Dette viser vel ganske så godt hva din holdning er, med mindre du faktisk har hatt tilgang til et nyere Vega kort med den  nye teknologien som er på plass.

Så fordi jeg vet hvordan AMD har implementert dette og hvile implikasjoner dette vil ha for ytelse så sier det noe om holdningen min???

 

Ja ja... Jeg får vel heller sluke alt som blir sagt rått da! :D

 

 

Du vet, HBM minne fungerer ikke på samme måte som GDDR5 /X

 

Det er ganske stor forskjell på teknologien som diskuteres , la oss faktisk se på pressekonferansen til Nvidia angående temaet :

2013

 

 

 

Next two GPUs from us: Maxwell is coming with unified virtual memory, which makes it possible for GPU operations to see the CPU memory and vice versa, so program-ability is easier. After that is Volta, which is even more energy efficient, which has a new technology called stacked DRAM.

 

Utviklingen gikk videre og man kom fram i 2016 til Unified Memory :

https://devblogs.nvidia.com/parallelforall/beyond-gpu-memory-limits-unified-memory-pascal/

 

I essens fikk Cpu tilgang til ( Unified Memory ) og gpu fikk tilgang til dette også. 

 

Den store forskjellen på Amd sin implementering er at  Gpu får tilgang til systemminnet direkte vil Nvidia sin løsning kreve at dette skjer via skjermkortminnet.

 

Nvidia sin løsning :

 

 

 The Page Migration engine allows GPU threads to fault on non-resident memory accesses so the system can migrate pages from anywhere in the system to the GPUs memory on-demand for efficient processing.

Amd sin løsning :

 

 

Litt mer "Buzz" 

https://www.techpowerup.com/231093/amd-vega-high-bandwidth-cache-controller-improves-minimum-and-average-fps

http://wccftech.com/amds-vega-doubles-usable-graphics-memory/

http://www.dsogaming.com/news/amds-vega-10-high-bandwidth-cache-controller-aims-to-improve-performance-by-almost-100-minimum-fps/

 

Edit : Burde vel påpeke at informasjon lagret fra SSD og andre kilder kan også gå direkte til AMD sin løsning, se videoene og forklaringene på pressekonferansene for en langt bedre forklaring enn det jeg kan gi.

 

Edit 2 : Og ja, fult mulig at Amd sin løsning ikke er noe å skryte høyt av, men inntil vi faktisk ser den i bruk i spill vil jeg personlig avvente med å si at den er ren markedsføring...

 

Endret av 097100106111101
  • Liker 1
Lenke til kommentar

Du vet, HBM minne fungerer ikke på samme måte som GDDR5 /X

I denne sammenheng fungerer det helt likt. Tn 512 GB/s båndbredde på HBM gir ikke noe bedre båndbredde enn 512 GB/s med GDDR5, GDDR5X eller GDDR6.

 

 

Det er ganske stor forskjell på teknologien som diskuteres , la oss faktisk se på pressekonferansen til Nvidia angående temaet :

2013

 

Next two GPUs from us: Maxwell is coming with unified virtual memory, which makes it possible for GPU operations to see the CPU memory and vice versa, so program-ability is easier. After that is Volta, which is even more energy efficient, which has a new technology called stacked DRAM.[/size]

 

Ser du har funnet et klipp fra 2013... I 2014 endret Nvidia GPU roadmap som du sikkert vet, og Pascal dukket opp mellom Maxwell og Volta.

Kepler og Maxwell støtter å gjøre "Unifed memory" i software, det vil si at driveren må må kopiere over data. Pascal implementerte dette i hardware, Volta bygger videre på dette.

 

 

Utviklingen gikk videre og man kom fram i 2016 til Unified Memory :

https://devblogs.nvidia.com/parallelforall/beyond-gpu-memory-limits-unified-memory-pascal/

 

I essens fikk Cpu tilgang til ( Unified Memory ) og gpu fikk tilgang til dette også.[]

 

Den store forskjellen på Amd sin implementering er at  Gpu får tilgang til systemminnet direkte vil Nvidia sin løsning kreve at dette skjer via skjermkortminnet.

 

Nvidia sin løsning :

 The Page Migration engine allows GPU threads to fault on non-resident memory accesses so the system can migrate pages from anywhere in the system to the GPUs memory on-demand for efficient processing.[/size]

Amd sin løsning :

 

 

Skjønner ikke helt hva du mener her jeg, det virker som at du heller ikke skjønner det helt selv.

 

Både AMD og Nvidia sine GPU'er har samme tilgang til systemminne. De er koblet til CPU over samme PCI Express bus.

 

Hvis Vega eller Pascal prøver å aksessere en virtuell adresse som ikke finnes i GPU minne vil GPU'en sin minnekontroller (MMU) generere noe som kalles en "page fault". Den komponenten i MMU som gjør dette kalles i en "page migration engine", dette vil via et interrupt starte en overføring fra systemminne inn til GPU, når dette overføringen er ferdig så sendes et nytt interrupt, og applikasjonen kan fortsette.

 

Både Vega og Pascal/Volta kan adressere 49-bit (48-bit i x86-64 og ett ekstra bit til å adressere GPU minne), noe som vil si at GPU kan adressere 512 TB med data.

 

 

Edit : Burde vel påpeke at informasjon lagret fra SSD og andre kilder kan også gå direkte til AMD sin løsning, se videoene og forklaringene på pressekonferansene for en langt bedre forklaring enn det jeg kan gi.

Den løsningen fikk Nvidia i 2013, den heter GPU Direct RDMA. Her kan en 3. parts NVMe-disk, nettverkskontroller, InfiniBand-kort eller andre 3. part komponenter flytte data rett inn og ut av GPU minne uten å gå via CPU.

  • Liker 3
Lenke til kommentar

Det som blir spennende å se, er om de har greid gjøre noe spesielt med den 2xVega som kommer. Det virker jo logisk at dette blir veien å gå fremover, flere mindre dies koblet sammen på en gpu. Her er noe Raja sa på ask reddit: 

"Infinity Fabric allows us to join different engines together on a die much easier than before. As well it enables some really low latency and high-bandwidth interconnects. This is important to tie together our different IPs (and partner IPs) together efficiently and quickly. It forms the basis of all of our future ASIC designs. We haven't mentioned any multi GPU designs on a single ASIC like Epyc, but the capability is possible with Infinity Fabric."

Men tviler det kommer på Vega, men kanskje de har fått det til på den 2x? Som fungerer som 1 kort, som går utenom crossfire. 

Lenke til kommentar

Det som blir spennende å se, er om de har greid gjøre noe spesielt med den 2xVega som kommer. Det virker jo logisk at dette blir veien å gå fremover, flere mindre dies koblet sammen på en gpu. Her er noe Raja sa på ask reddit: 

 

"Infinity Fabric allows us to join different engines together on a die much easier than before. As well it enables some really low latency and high-bandwidth interconnects. This is important to tie together our different IPs (and partner IPs) together efficiently and quickly. It forms the basis of all of our future ASIC designs. We haven't mentioned any multi GPU designs on a single ASIC like Epyc, but the capability is possible with Infinity Fabric."

 

Men tviler det kommer på Vega, men kanskje de har fått det til på den 2x? Som fungerer som 1 kort, som går utenom crossfire. 

Det er absolutt ikke logisk å tenke at flere identiske GPUer på samme kort er veien å gå videre, det er bare å se på utfordringene 3DFX møtte for å skjønne hvorfor.

 

En mer fornuftig tankegang for Infinity Fabric er å få raskere og mer effektiv kommunikasjon mellom CPU, GPU, og eventuelt andre prosessorer, merk også at det er slik bruk AMD markedsfører Infinity Fabric for. Eksisterende Ryzen-produkter bruker jo allerede Infinity Fabric, det er derfor enkelte spill kan kjøre raskere om man skrur av halvparten av kjernene på en Ryzen 1700X.

 

Hvis AMD ikke får det til med 1x Vega er det forøvrig svært god grunn til å tro at 2x Vega vil være et fenomenalt dårlig produkt. Håpet er vel at Vega 10 skal klare å vise at AMD har tatt igjen Nvidia på minnebåndbredde-effektivitet.

Lenke til kommentar

3DFX sin problematikk er vel ikke så veldig relevant 15år etter eller? Å lage gpu blir bare mer og mer kostbart med større og større die. Det vil si stopp der før eller siden, samme med klokkehastighet/varme. Noe nytt må skje på gpu fronten. Det er ulogisk å ikke tro at dette er veien å gå fremover.

Lenke til kommentar

Den som har ventet på vega må vente enda lengre, i følge guru3d.com :/

 

Ser ut som det, ja.

Så dette kan bli andre satsing på moderne HBM minne som ødelegger for AMD og skjermkortdivisjonen, her burde Raja Kodouri hatt en backupløsning på plass, men det er også mye som er på spill denne gangen.

 

I utgangspunktet slik jeg forstår det var det meningen at man skulle få lansert i slutten av 2016... Nope. Selv om selve gpu'en var nå "ferdigstilt" så drøyde det på seg.

 

Så man kan spørre seg hva selskapet har gjort i mellomtiden, har de fått finpusset skjermkortene til lansering ved å jobbe hardt med drivere? Har de forbedret selve PCB'en som skjermkortene skal fungere på, samt testet hvor mye strøm som behøves for å ikke gjøre samme tabbe som ved lanseringen av RX 480 ?

 

I utgangspunktet så er det en del løsninger som ser ut til å ha potensiale som High Bandwith Cache og High Bandwith Controller, og fungerer det som vist i presentasjonene over på de spillene som utnytter dette ,( jeg antar at det vil også kreve at man har en relativ kjapp SSD / greit med systemminne ) så kan det i alle fall gi mange spillere med nye Amd skjermkort fordelene med at man slipper den berømte luggingen når fps plutselig dropper ned til 1fps i en brøkdel av et sekund.

 

Og siden minnet på de nye skjermkortene til Amd sitter rett på gpu'en og ikke fordelt rundt på selve skjermkortet som Nvidia sin løsning så kan det vise seg at dette faktisk har en fordel med tanke på teknologien.

 

Må nesten bare anbefale å lese denne artikkelen for litt mer informasjon om teknologien som kommer :

 

http://www.pcworld.com/article/3153726/components-graphics/radeon-vega-revealed-5-things-you-need-to-know-about-amds-cutting-edge-graphics-cards.html

 

Og som Amd bekreftet litt tidligere vil skjermkortet som er myntet på vanlige spillere være noe raskere : 

http://www.pcworld.com/article/3197666/components-graphics/amds-radeon-rx-vega-graphics-cards-will-be-faster-than-the-frontier-edition.html

Endret av 097100106111101
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...