Gå til innhold

Hvilken prosessor er best på Super PI?


snorreh

Anbefalte innlegg

Snorreh, hvorfor har du ikke tatt hensyn til det timtowtdi sier?

I regnestykket der du beregner skalering deler du på den absolutte forskjellen i Gigahertz, og ikke den forholdsmessige forskjellen.

 

Altså, forskjellen på en 4 GHz og en 3 GHz prosessor ville ifølge dine beregninger fått et forholdstall på 1 (4 minus 3), og det stemmer ikke. Du må beregne den forholdsmessige økningen i Hz, altså 4 delt på 3 eller 3 delt på 4.

 

Forskjellen på 2 GHz vs 1 GHz er mye større forholdsmessig enn forskjellen mellom 4 GHz og 3 GHz, men i ditt regnestykke ville ikke det blitt gjenspeilet.

 

Rett skal være rett. :)

 

Edit: Hm... Nei, nå ble jeg usikker. Du tar jo tross alt absolutt forskjell i ytelse også, og ikke forholdsmessig forskjell i ytelse. Kanskje det er greit likevel da!?

Endret av Pureblade
Lenke til kommentar
Videoannonse
Annonse

snorreh: Det jeg tror anandtech mener med at SuperPI viser "system bandwith" så bra er at "system bandwith" er pur regnekraft og altså antall beregninger per sekund gjennom pipelinene. Dvs. at "system bandwith" er noe helt annet enn båndbredde på f.eks FSB, til minnet, eller andre deler systemet. SuperPi er altså en god benchmark for å teste rå CPU-kraft uten at båndbredde til resten av PC'en og andre flaskehalser skal forstyrre målingene. Testen måler altså ikke PC'ens tortale ytelse, men kun hva selve CPU-kjernen er kapabel til.

 

PS. Du skriver mye bra og fornuftig, men jeg er enig med mange andre her om at (begge) aksene bør starte på 0. På den måten får man litt håndfast følelse på hvor bratt kurvene er. Man kan også se at f.eks en CPU som yter dobbelt så bra som en annen når et punkt er halveis nede på y-aksen i stedet for på toppen.

 

Gleder meg til du får med grafene for AthlonXP og evt andre CPU'er.

 

Generellt mener jeg ikke at man kan måle all verden med SuperPi, men det sier mye om den interne FPU'en og hvordan denne yter generellt. (til andre ting enn SuperPi også) Så kan man bruke dette resultatet til å si om det er andre faktorer enn FPU'en som hindrer eller fremmer ytelsen til forskjellige CPU'er i forskjellige andre tester.

 

Edit2: SuperPi var forresten skrevet for veldig mange år siden (1995?) og tar derfor ikke i bruk nyere instrukssjonssett som MMX, 3DNow!, SSE, 3DNow! Enhanced, SSE2, eller x86-64. SuperPi tester altså kun x87-FPU'ens ytelse. (Den er fortsatt veldig relevant selv om de nye instruksjonene har tatt over en del av jobben til FPU'en i mange programmer)

Endret av Simen1
Lenke til kommentar
Edit: Hm... Nei, nå ble jeg usikker. Du tar jo tross alt absolutt forskjell i ytelse også, og ikke forholdsmessig forskjell i ytelse. Kanskje det er greit likevel da!?

Ikke bli usikker!

 

Det feilaktige elementet er nettopp at resultatet inkluderer klokkehastigheten, litt paradoksalt siden AMD fanatikere er så glade i å fremheve at klokkehastighet ikke betyr noen ting og at ytelsen er det som teller.

 

Tydeligvis har man oppdaget at man veldig hendig kan flytte noe så subtilt som forskjellen i klokkehastighet under brøkstreken - og så plutselig får pipen i dette tilfellet lyden av basuner ;-)

 

Men for å gjenta meg selv: Testen viser helt utvetydig at de nye AMD prosessorene er klart raskere på integerkalkulasjoner enn de nye Pentium prosessorene. Men hvorfor kalle en spade for en manuell granulat relokasjons artifakt?

 

timtowtdi

Lenke til kommentar
Men hvorfor kalle en spade for en manuell granulat relokasjons artifakt?

LOL :D

 

Ikke bli usikker!

 

Nei, jeg skulle visst ikke blitt det. Har regnet litt mer på det nå, for å være sikker. Facts følger...

 

Tenkt tilfelle: La oss si at vi har 32 iterasjoner som skal gjennomføres.

 

Vi har så to arkitekturer/prosessorer som skalerer perfekt (100%).

Prosessor A bruker 16 sekunder ved 1 GHz.

Prosessor B bruker 16 sekunder ved 3 GHz.

 

Pa: 16 sekunder på 32 iterasjoner = 2 iterasjoner per sekund.

Pb: 16 sekunder på 32 iterasjoner = 2 iterasjoner per sekund.

 

Vi skrur så opp hastigheten med 1 GHz på begge for å finne ut hvem som skalerer best (selv om vi egentlig vet at de skalerer perfekt, så gjør vi dette for å verifisere teorien):

 

Pa bruker nå 8 sekunder på jobben. Halvparten av tiden, ettersom frekvensen er doblet (1 til 2 GHz).

Pb bruker nå 12 sekunder på jobben. Tre firedeler av tiden, ettersom frekvensen er økt med en tredel (3 til 4 GHz).

 

Dette er som forventet, og vi har altså bevist at begge arkitekturer skalerer perfekt.

 

Men med snorrehs regnestykke blir det slik:

Pa: 8 sekunder på 32 iterasjoner = 4 iterasjoner per sekund.

Pb: 12 sekunder på 32 iterasjoner = 2.67 iterasjoner per sekund.

 

Skalering:

Pa: (4.00-2.00)/(2-1) = 2.00/1 = 2.00 = 200%

Pb: (2.67-2.00)/(4-3) = 0.67/1 = 0.67 = 67%

 

Som vi ser, så deles begge differansene i ytelse på 1, og dette er feil, ettersom 1 GHz utgjør mye større sprang for prosessor A enn for prosessor B. Det ser feilaktig ut som om prosessor A skalerer med 200%, altså mye bedre enn prosessor B, som bare skalerer 67%.

 

Regnestykket skulle vært slik, for å få de riktige forhold:

Pa: (4.00/2)/(2/1) = 2.00/2.00 = 1.00 = 100%

Pb: (2.67/2)/(4/3) = 1.33/1.33 = 1.00 = 100%

 

Som vi ser, så skalerer begge arkitekturene her 100%, som er det korrekte svaret.

 

Fra best til dårligst så får vi følgende rangering:

Opt: (0.487-0.358)/(2.2-1.6)=0.129/0.6=0.215

A64: (0.475-0.432)/(2.2-2.0)=0.043/0.2=0.215

P4C: (0.442-0.297)/(3.2-2.4)=0.145/0.8=0.181

P4E: (0.452-0.404)/(3.2-2.8)=0.048/0.4=0.120

 

Om vi gjør om dette regnestykket i henhold til min mal, over, så blir det slik:

Opt: (0.487/0.358)/(2.2/1.6)=1.360/1.375=0.989=99%

A64: (0.475/0.432)/(2.2/2.0)=1.100/1.100=1.000=100%

P4C: (0.442/0.297)/(3.2/2.4)=1.488/1.333=1.116=112%

P4E: (0.452/0.404)/(3.2/2.8)=1.119/1.143=0.979=98%

 

Dette var de samme resultatene som timtowtdi fikk for en del poster siden.

 

Konklusjon: P4C skalerer best. Etter en økning på 33% i klokkefrekvens (fra 2.4 til 3.2) går ytelsen (iterasjoner per sekund) opp 49% (fra 0.297 til 0.442 per sekund). Målingene testen baserer seg på må altså være feil, eller så jobber faktisk P4C fortere pr. MHz jo raskere den blir. Kan det stemme da?

Lenke til kommentar
Edit1:
* generaliserte konklusjoner
Poenget med en konklusjon er at den SKAL være generalisert. Detaljene finner man før konklusjonen. Med generalisert mener jeg ikke at man kan måle all verden med SuperPi, men det sier mye om den interne FPU'en og hvordan denne yter generellt. (til andre ting enn SuperPi også) Så kan man bruke dette resultatet til å si om det er andre faktorer enn FPU'en som hindrer eller fremmer ytelsen til forskjellige CPU'er i forskjellige andre tester.

Det du egentlig mener å si er at en konklusjon skal være generell, ikke generaliserende. Det er to svært forskjellige ting!

 

http://www.dokpro.uio.no/ordboksoek.html

 

generalisere ~e´re v2 gi allmenn gyldighet; stille opp allmenne regler på grunnlag av enkelttilfeller en må være forsiktig med å g-

 

generell adj -elt, -e (utt sjenerel'l; gj ty. fra lat. generalis, se *general-) allmenn, alminnelig, allmenngyldig gi en g- orientering, karakteristikk / adv: (rent) generelt kan en si at ... / det later til å være et generelt problem / g-e drøftinger / det hersket g- forvirring .

Endret av Knick Knack
Lenke til kommentar

Er ikke "generalisere" bare verb-versjonen av adjektivet "generell"?

 

I henhold til ordbokdefinisjonene dine, så er en ting som er generell allmenngyldig. For å komme til en generell konklusjon ut i fra enkelttilfeller (dvs. detaljene, testdataene presentert på forhånd), så må man generalisere, dvs. trekke ut det allmenngyldige fra eksemplene!?

Lenke til kommentar
PS. Du skriver mye bra og fornuftig, men jeg er enig med mange andre her om at (begge) aksene bør starte på 0.

Tja, slik ser den ut da:

SuperPI-2.jpg

 

Ser den bedre ut synes du? Det synes ikke jeg så derfor klippet jeg aksene.

 

Gleder meg til du får med grafene for AthlonXP og evt andre CPU'er.

Jeg har nå oppdatert den og tatt med resultater for Athlon XP (Barton) og P4B (Northwood), alle med DDR400 minne selvsagt :)

Endret av snorreh
Lenke til kommentar
Snorreh, hvorfor har du ikke tatt hensyn til det timtowtdi sier?

I regnestykket der du beregner skalering deler du på den absolutte forskjellen i Gigahertz, og ikke den forholdsmessige forskjellen.

Jeg var interessert i se hvilken prosessor som skalerer best på Super PI-testen pr. MHz, så jeg ser ikke problemet :dontgetit:

Lenke til kommentar
Men for å gjenta meg selv: Testen viser helt utvetydig at de nye AMD prosessorene er klart raskere på integerkalkulasjoner enn de nye Pentium prosessorene.

Det skal vel godt gjøres å beregne PI mha. integer ;) Du mener vel flytetall håper jeg :)

Jeg gjør nok det :yes: tror Super PI kanskje bruker både floating point og integer ut fra algoritmene i dokumentasjonen iallefall.

 

Har lest litt både om RC-5/72 og Super PI de siste dagene, og det er lett å blande kortene ;-)

 

Takk for oppklaringen.

 

timtowtdi

Lenke til kommentar
Jeg var interessert i se hvilken prosessor som skalerer best på Super PI-testen pr. MHz, så jeg ser ikke problemet :dontgetit:

Er det samme jeg er interessert i. Men det blir vel feil når du bruker absolutte tall i stedet for forholdsverdier når du skal beregne skalering? :dontgetit:

 

Edit: Det du ønsker å finne er "hvem får mest ytelse ved at vi skrur opp hastigheten med 30%", sant? Og ikke "hvem får mest ytelse ved at vi skrur opp hastigheten 1 GHz". Sistnevnte vil i så fall favorisere lavere klokkede arkitekturer som K8 og P-M.

Endret av Pureblade
Lenke til kommentar
Jeg var interessert i se hvilken prosessor som skalerer best på Super PI-testen pr. MHz, så jeg ser ikke problemet :dontgetit:

Er det samme jeg er interessert i. Men det blir vel feil når du bruker absolutte tall i stedet for forholdsverdier når du skal beregne skalering? :dontgetit:

 

Edit: Det du ønsker å finne er "hvem får mest ytelse ved at vi skrur opp hastigheten med 50%", sant? Og ikke "hvem får mest ytelse ved at vi skrur opp hastigheten 1 GHz".

Enig, men det er mange måter å beregne slikt på. Jeg prøvde bare å kommentere kurvene så objektivt som mulig, men det var kanskje en dårlig idé? :roll:

Endret av snorreh
Lenke til kommentar

Hvis noen har Super PI-resultater for Athlon XP (Barton) 3000+ (400FSB), Athlon XP (Barton) 2600+ (333FSB), P4C (800FSB) 2.6GHz og 3.4GHz med DDR400 minne så hadde jeg satt pris på det. Standard klokket selvsagt :)

 

Super PI-resultat for Opteron 140/240 hadde også vært fint :)

Endret av snorreh
Lenke til kommentar
Jeg var interessert i se hvilken prosessor som skalerer best på Super PI-testen pr. MHz, så jeg ser ikke problemet :dontgetit:

Er det samme jeg er interessert i. Men det blir vel feil når du bruker absolutte tall i stedet for forholdsverdier når du skal beregne skalering? :dontgetit:

 

Edit: Det du ønsker å finne er "hvem får mest ytelse ved at vi skrur opp hastigheten med 50%", sant? Og ikke "hvem får mest ytelse ved at vi skrur opp hastigheten 1 GHz".

Enig, men det er mange måter å beregne slikt på. Jeg prøvde bare å kommentere kurvene så objektivt som mulig, men det var kanskje en dårlig idé? :roll:

Du trenger da ikke himle med øynene... Jeg prøver bare å komme frem til hva som er korrekt her. Klart det finnes flere måter å regne det ut på, men hvorfor får vi forskjellig svar?

 

Herbie: Grafene viser at den oransje faller raskest, om ikke øynene mine bedrar meg. Det betyr vel at P4C skalerer best ut i fra disse tallene?

Lenke til kommentar
Enig, men det er mange måter å beregne slikt på.  Jeg prøvde bare å kommentere kurvene så objektivt som mulig, men det var kanskje en dårlig idé? :roll:

Du trenger da ikke himle med øynene... Jeg prøver bare å komme frem til hva som er korrekt her. Klart det finnes flere måter å regne det ut på, men hvorfor får vi forskjellig svar?

 

Herbie: Grafene viser at den oransje faller raskest, om ikke øynene mine bedrar meg. Det betyr vel at P4C skalerer best ut i fra disse tallene?

Godt spørsmål, jeg vet faktisk ikke. P4C (800FSB) skalerer best fra 2.4-2.8GHz muligens, men det forutsetter at Super PI-resultatet for 2.4GHz er korrekt og det er jeg litt usikker på (?). Jeg mangler også Super PI-resultater for Athlon XP (Barton) 2600+ (333FSB), P4C (800FSB) 2.6GHz, P4C (800FSB) 3.4GHz og Opteron 140 så grafen er langt ifra komplett dessverre. Noen som kan hjelpe meg her?

 

PS: Jeg har nå oppdatert grafen for å vise datapunktene jeg bruker bedre.

Endret av snorreh
Lenke til kommentar

snorreh: Takk, når synes jeg grafene blir enklere å tolke. :thumbup:

 

Det som slår meg nå er at alle kurvene følger omentrent samme "formel". Dvs. at antall sekunder = C/GHz, der "C1" er en konstant som gjelder for hver CPU-serie. Dette er jo også ganske logisk i forhold til at tidsbruk = C2/GHz for en applikasjon som kun er begrenset av CPU'en, på en gitt CPU-serie med konstanten C2. I den forbindelse hadde det vært gøy om du hadde lagt inn en vag striplet linje etter formelen C/GHz, med en C som legger linjen midt mellom alle CPU'ene. Denne linejen kan sikkert bekrefte at CPU'ene følger denne formelen sånn någen lunde.

 

PS. Det kan være grunn til å undersøke tallene for P4-533 på nytt siden kurven avviker såpass fra resten av trendene.

Lenke til kommentar

Takk for tilbakemeldingene alle sammen! :yes:

 

Jeg har nå oppdatert grafen med flere resultater (bl.a. Athlon XP (400FSB)), selv om jeg fortsatt mangler noen resultater. Det hadde også vært fint å fått verifisert de resultatene jeg allerede har, da noen er hentet fra diverse forum-tråder o.l. for å se om de faktisk stemmer :)

 

Jeg har også fjernet min veldig omdiskuterte konklusjon ;)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...