Gå til innhold

Firedoble AMD-prosessorer i 2007?


Anbefalte innlegg

Videoannonse
Annonse

Høres ut som en heftig server CPU, men totalt ubrukelig på dagens desktop applikasjoner. Selv typiske workstation programmer vil ha problemer med utnytte en eller to slike moduler. På den andre siden er vel dette bare nok et hint om fremtiden. IPC og klokkefrekvens er parametre som det i stor grad er optimalisert for i arkitekturen til det ytterste av hva som er fornuftig. Da er multicore og forbedringer i minnesystemet siste og eneste utvei. Alle de gode ideene IMB kokte i hop i en eller annen arkitektur flopp på 60-70 tallet er brukt opp. Litt leit. På tide å tenke nytt.

Lenke til kommentar

Hvis de deler minnekontroller, kan det da tyde på at vi egentlig ser på en "billig-løsning" for de som ønsker flere prosessorer, men ønsker man det optimalt bør man fortsatt går for to eller flere enkle prosessorer?

 

Knick Knack, er det noen spesiell grunn til at du tror det vil være totalt ubrukelig for annet enn server? Om det vil fungere som to prosessorer (med untak av delt minnekontroller) må det jo heller være en god løsning for rimelige arbeidsstasjoner (ref. min kommentar over)

Lenke til kommentar
Høres ut som en heftig server CPU, men totalt ubrukelig på dagens desktop applikasjoner. Selv typiske workstation programmer vil ha problemer med utnytte en eller to slike moduler.

Tja, mye kan skje frem til 2007 på programfronten. Neste år er det dual-kjerne prosessorer for alle pengene, så da blir quad-kjerne det neste steget. Tendensen er ganske klar allerede, mer og mer flertrådet programvare utvikles nå.

 

På den andre siden er vel dette bare nok et hint om fremtiden. IPC og klokkefrekvens er parametre som det i stor grad er optimalisert for i arkitekturen til det ytterste av hva som er fornuftig. Da er multicore og forbedringer i minnesystemet siste og eneste utvei. Alle de gode ideene IMB kokte i hop i en eller annen arkitektur flopp på 60-70 tallet er brukt opp. Litt leit. På tide å tenke nytt.

Jeg tror du har missforstått litt her. Det handler mer om å integrere flere ting på prosessoren, først HyperTransport og minnekontroller, så da blir flere kjerner og minnekontrollere neste naturlige steg. Det er heller ingenting som tyder på at K8-kjernen sliter med dårlig IPC, snarere tvert imot ettersom ytelsen så langt har øket superlineært med klokkefrekvensen. Ingen andre x86-arkitekturer kan vise til en like bra ytelsesøkning. Hvis du tar kikk på arkitekturen til Alpha, som kan kalles storebroren til Opteron, så ser du at det fortsatt er mange gode ideer å ta av.

Lenke til kommentar
Hvis de deler minnekontroller, kan det da tyde på at vi egentlig ser på en "billig-løsning" for de som ønsker flere prosessorer, men ønsker man det optimalt bør man fortsatt går for to eller flere enkle prosessorer?

Hvordan AMD løser dette vet vi ikke så mye om ennå, men du kan være sikker på at minnebåndbredden ikke vil bli noen flaskehals. Jeg tipper at det blir en minnekontroller på dual-kjerne, og to minnekontrollere på quad-kjerne. Siden kjernene finnes på samme prosessoren så vil tilgangstiden ('latency') mot minnet reduseres ytterligere sammenlignet med idag, som resulterer at ytelsen blir merkbart forbedret.

Endret av snorreh
Lenke til kommentar

Rart de ikke allerede har kommet med prosessorer med flere kjerner. At dette kun skal ha noen hensikt i windows og ikke i spill ser jeg ikke helt grunnen til. Alt kan lages, og om det vil fungere kommer helt an på hvem som gjør det og hvordan man gjør det.

Lenke til kommentar

Interessant, dual core ser jeg stort behov for, personlig synes jeg HyperThreading er natt og dag (å bruke maskiner uten gjør rett og slett gjør meg irritert) og dual core er enda bedre.

 

Så kjapt støtten for SMT/SMP er allmenn (noe den utvilsomt vil være i 2007) tror jeg quad core kan blir svært bruktbart. Med dual core fikk jeg et inntrykk av at AMD ventet for å se om Intel gjorde alvor av det (for så selv å svare med en egen dual sak) men nå er det helt tydlig at AMD også er med på leken :)

 

Ser ellers AMD velger en liknende løsning som Intel med delt L2 cache (rykter sier Intel gjør det den veien, men med vesentlig mer cache) og en arbiter bus (i dette tilfelle sikkert Hyper-Transport, som utvilsomt vil markedsføres som noe "mer og bedre" enn en annen minst like egnet bus :p ). Blir uansett spennende å se en dual kjerne P-M mot en dual kjerne A64. :thumbup:

 

Såvidt jeg forsto inneholdt E-rev bare 11 av de 13 nye SSE3 (PNI) instruksjonene, så det kan naturligvis kalles SSE2.9 eller noe slikt - SSE3 er det faktisk ikke.

Lenke til kommentar

Vel, når flere kjerner introduseres i desktopmiljøet så er blir vel vi mer avhengig av at softwaren som brukes er utviklet til å kunne utnytte disse mulighetene mer og mer. Selve multimedia delen vil nok kunne fungere langt bedre enn før og man har mulighet til å kunne bruke pcen på uante måter.

 

Kan vel sikkert bli sånn at man har en slags løsning hvor det er en datamaskin som gir tilgang til flere brukere i huset, barna på rommet sitter og spiller spill mens husmor finner frem oppskrifter på internet via en trådløs touchscreen på kjøkkenet mens far i huset sitter og gjør regnskap på kontoret sitt, alt med samme datamaskin. Kan jo godt være at vi sitter med DDR3 allerede neste år, men det er vel litt tvilsomt, synd at det går såpass sakte med desktop miljøet å få introdusert ny minneteknologi.

Lenke til kommentar
Quack 3(husker ikke åssen det staves) har, hvis jeg husker riktig, støtt for flerprosessor.

Japp, Quake 3 har "dual støtte", i visse tilfeller kan du tjene ~2 FPS på CPU/tråd nummer to.:p Dual/HT i dag gjør maskinen mer behagelig/responsiv å bruke, men i spill er det enda lite å hente, ytelsemessig.

 

Men skal støtten noengang komme så er det viktig at hardwaren er på plass - det er den heldigvis så det er bare et spørsmål om tid :)

Lenke til kommentar
Japp, Quake 3 har "dual støtte", i visse tilfeller kan du tjene ~2 FPS på CPU/tråd nummer to. Dual/HT i dag gjør maskinen mer behagelig/responsiv å bruke, men i spill er det enda lite å hente, ytelsemessig.

 

Men skal støtten noengang komme så er det viktig at hardwaren er på plass - det er den heldigvis så det er bare et spørsmål om tid

 

Den siste linja= "words"

Lenke til kommentar
Tja, mye kan skje frem til 2007 på programfronten.  Neste år er det dual-kjerne prosessorer for alle pengene, så da blir quad-kjerne det neste steget.  Tendensen er ganske klar allerede, mer og mer flertrådet programvare utvikles nå.

 

Mye må skje om en skal kunne utnytte flere kjerne. Det er liten prinsippiell forskjell på multicore og SMP. Forskjellen ligger hovedsakelig i at en får noe bedre forhold for å takle cache coherency og minne forsinkelser. Det er en rimelig opplagt sak at mange programmer ikke egner seg for multitråding. De som gjør det vil selvsagt kunne utnytte flerkjerne i 2007 slik de kan utnytte SMP dag og kanskje enda litt bedre. Disse programmene er imidlertid typisk server programmer. Beste unntak er rendering.

 

Jeg tror du har missforstått litt her.  Det handler mer om å integrere flere ting på prosessoren, først HyperTransport og minnekontroller, så da blir flere kjerner og minnekontrollere neste naturlige steg. Det er heller ingenting som tyder på at K8-kjernen sliter med dårlig IPC, snarere tvert imot ettersom ytelsen så langt har øket superlineært med klokkefrekvensen. Ingen andre x86-arkitekturer kan vise til en like bra ytelsesøkning.  Hvis du tar kikk på arkitekturen til Alpha, som kan kalles storebroren til Opteron, så ser du at det fortsatt er mange gode ideer å ta av.

 

For det første har jeg ikke antydet at k8 sliter med dårlig IPC. Det jeg snakker om er en langt mer generell trend. Det er mange som mener at superskalare arkitekturer ikke kommer til å bli særlig bredere enn k8 og Dothan er. Årsaken er at det blir for kostbart for prosessoren å utforske slike mengder ILP. Da er eneste forbedringspotensiale å øke frekvensen eller øke antall kjerner. "Diminishing returns" slår ofte inn hardt allerede ved øking fra en til to kjerner. Det er veldig avhengig av programmet. Selvsagt finnes det programmer som kan kjøres på clustre med til sammen flere tusen kjerner, men disse representerer bare et lite fåtall.

 

Ellers er det selvsagt både fint og naturlig at mer og mer blir integrert. Det kommer riktig nok ann på hva en ønsker å vektlegge. Tror kanskje Power5 er et bedre eksempel på hva som er mulig å gjøre med integrering enn Alpha. Sistnevnte er bare smågutt i forhold. Så, ja det er fortsatt forbedringspotensiale for superskalare arkitekturer, men x86 har alt for mange ulemper heftet ved seg til å kunne oppnå samme ytelse som IBM Power på tilsvarende produksjonsprosess. Mangelen på registre er kanskje en av de alvorligste. 16GPR's setter en stor bremse for prosessorens mulighet til å utforske ILP.

 

btw: Der jeg skrev IMB i forrige post skulle det selvsagt stå IBM...

Lenke til kommentar
Quack 3(husker ikke åssen det staves) har, hvis jeg husker riktig, støtt for flerprosessor.

Japp, Quake 3 har "dual støtte", i visse tilfeller kan du tjene ~2 FPS på CPU/tråd nummer to.:p

Vel, egentlig så kjører Q3 lydprosseseringen i CPU1 når r_smp = 1, men trådene må sikkert vente på hverandre og latency øker sikkert kraftig, så du tjener mindre og mindre jo raskere prosessorene er. Med dual Celeron 400 MHz f.eks kan du oppleve +40-60% FPS, men med to 2+ GHz prosessorer, så er det mer sannsynlig at du får mindre FPS. Om jeg husker rett, så ble r_smp funksjonen dissabled for lenge siden og fungerer ikke lenger.

Lenke til kommentar
Med dual Celeron 400 MHz f.eks kan du oppleve +40-60% FPS, men med to 2+ GHz prosessorer, så er det mer sannsynlig at du får mindre FPS. Om jeg husker rett, så ble r_smp funksjonen dissabled for lenge siden og fungerer ikke lenger.

Min dual Celeron 466 gav knapt noen merkbar økning, dual P3 933ene lurer jeg på om ikke gav en liten knekk i ytelsen (men nå kjørte jeg dem på et dual-VIA hovedkort - som var søppel, men det er en anna historie).

 

Tror og funksjonen er disablet idag, har testet på HT P4'en men der var det null forskjell.

Lenke til kommentar

Dagens spill er gpu-begrenset, ikke cpu-begrenset, det er derfor liten/ingen gevinst ved å kode spill for smp og dessuten kompliserer utviklingen av spillet veldig mye. Slik vil det trolig være en god stund enda.

 

Men det er helt klart et stort potensiale her, tenk deg en AI med dedikert prosessor for å yte deg motstand :cry:

 

r_smp ble slått av i pr 1.27 om jeg husker riktig.

Endret av Tanguero
Lenke til kommentar

År 2007:

Hvis 4 kjerner blir den nye high-end Opteron'en så skal vi ikke se bort i fra at 2-kjerne CPU'er kommer så langt ned i pris at de kan sammenlignes prismessig med dagens Athlon64 FX eller Athlon64. Jeg regner samtidig med at 1-kjerne CPU'ene gradvis vil porisjonere seg som billigalternativet aka Sempron.

 

Det er også svært interresant å lese at minnekontrolleren skal være "sterkt forbedret". Det kan bare bety ennå bedre IPC. Jeg la spesiellt merke til at de plutselig velger å ikke støtte DDR2. Dette kan bety at AMD backer helt ut fra DDR2 teknologien og kanskje satser på DDR3 eller FBdimm, XDram, eller noe annet i stedet for. Det blir selvfølgelig bare spekulasjoner, men det er likevel et interresant hint vi kan tenke på.

 

4 CPU'er på en kjerne kan også tyde på at AMD tror den kan utvikle så lite varme på 65nm at det lar seg gjøre å kjøle en slik på et fornuftig vis. Bare det i seg selv viser at AMD har stor tro på fremtidig krymping av produksjonsprosessen. Dette strider stikk i mot enkelte "profeter" som har sagt at 90nm-utviklingen er på randen av hva som er praktisk å utvikle.

Lenke til kommentar
Ser ellers AMD velger en liknende løsning som Intel med delt L2 cache (rykter sier Intel gjør det den veien, men med vesentlig mer cache) og en arbiter bus (i dette tilfelle sikkert Hyper-Transport, som utvilsomt vil markedsføres som noe "mer og bedre" enn en annen minst like egnet bus :p ).

Feil, AMD sin dual-kjerne vil ikke ha delt L2 cache som betydelig reduserer ytelsen. Ifølge VR-Zone så vil hver kjerne på AMD sin dual-kjerne prosessor ha 1MB L2 cache:

http://www.vr-zone.com/?i=1123

The Dual core has up to 1MB L2 cache per CPU, up to 3 HT link operating at 1Ghz max and a shared northbridge registers with one APIC per core.

 

Såvidt jeg forsto inneholdt E-rev bare 11 av de 13 nye SSE3 (PNI) instruksjonene, så det kan naturligvis kalles SSE2.9 eller noe slikt - SSE3 er det faktisk ikke.

Nei, det stemmer heller ikke. AMD har nok heller kuttet ut de 2 instruksjonene som har med HyperThreading å gjøre, da disse ikke vil være nødvendige og følgelig helt bortkastet å implementere.

Lenke til kommentar

Det var vel snakk om G5 multi core som skal dele L2 minnet 1MB på på 2 core. Den kommer hvist til å hete PPC970MP den kommer nok sikker til å komme snart til en eller annen apple PM, siden PPC970 er laget som 1CPU som er bygget for bare å ta en core til uten å gjøre noen forandringer på arkitekturen.

 

Vel IBM har jo 8core eller noe sånt på Power 5. Det er jo også kjent at PPC970 skalerer bedre enn K8 CPUer. Du kan jo bare se på Big mac som knuser dobelt så mange Operton på SAMME klokkehastighet.

 

Selfølgelig er mulit core fremtiden for å få bedre resultater. Angående programmer så trenger ikke programmene å SMT/SMP, så lenge OSet er det. Eks så er mange Linux, unix (der under også mac os x) og andre slik at hvis du har en dual maskin så bare tar den å flytter over noen av oppgavene på en annen CPU. Men det vil ikke føre til at hastighetene vil øke men at d vil kunne gjøre dobelt så mange ting men med samme fart. Dual core er også bedre enn vanlig dual siden den er nærmere selv om det aldri vil bli en 100% økning så blir det såfall nærmerer. Hvis dere er innteresert så kan dere lese litt om Amdahl's Law and Gustafson's Law her http://www.cis.temple.edu/~shi/docs/amdahl/amdahl.html

Lenke til kommentar
Ser ellers AMD velger en liknende løsning som Intel med delt L2 cache (rykter sier Intel gjør det den veien, men med vesentlig mer cache) og en arbiter bus (i dette tilfelle sikkert Hyper-Transport, som utvilsomt vil markedsføres som noe "mer og bedre" enn en annen minst like egnet bus :p ).

Feil, AMD sin dual-kjerne vil ikke ha delt L2 cache som betydelig reduserer ytelsen. Ifølge VR-Zone så vil hver kjerne på AMD sin dual-kjerne prosessor ha 1MB L2 cache:

http://www.vr-zone.com/?i=1123

The Dual core has up to 1MB L2 cache per CPU, up to 3 HT link operating at 1Ghz max and a shared northbridge registers with one APIC per core.

Så vidt jeg kan se av siteringen din så presiserer ikke VR-Zone om det er 1MB dedikert per CPU eller 1MB delt per CPU.

 

Jeg skjønner heller ikke hvorfor det å dele 2MB L2 cache skal være så mye mer ineffektivt enn å ha 2x1MB dedikert per CPU. Jeg kan godt tenke meg situasjoner der det er gunstig å ha fleksibiliteten av mengden L2 cache som skal prioriteres til hver CPU. Og situasjoner der "cache coherency" vil fungere bedre med delt L2 cache. Uten å si noe sikkert om hva som lønner seg best totalt sett så synes jeg det er verd å undersøke litt nærmere først. (Noe trolig AMD jobber med i utviklings'laben sin nå)

 

Dagens spill er gpu-begrenset, ikke cpu-begrenset, det er derfor liten/ingen gevinst ved å kode spill for smp og dessuten kompliserer utviklingen av spillet veldig mye. Slik vil det trolig være en god stund enda.

 

Men det er helt klart et stort potensiale her, tenk deg en AI med dedikert prosessor for å yte deg motstand cry.gif

Det er ennå en del spill som er en del CPU-begrenset. Bl.a. FarCry og Doom3 er begrenset til rundt regnet 70-80FPS. Dvs. at du ikke får høyere FPS uansett hvor lavt du setter oppløsninga. HL2 kan fort vise seg å også bli CPU-begrenset. Om den potensielle ytelsen kan dobles ved å kjøre to tråder så tviler jeg ikke på at spillutviklerene kommer til å ta i bruk flere tråder i fremtiden.

 

Men når det er sagt så er min drømme CPU anno 2007 en Low voltage dual Athlon64 FX 65nm. Lav varmeutvikling, høy ytelse og bedre-enn-HyperThreading teknologi.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...