Gå til innhold

"Prescott" treffer nettet


Anbefalte innlegg

Videoannonse
Annonse
Du har foreløpig ignorert det viktigste. Se lengre opp.

 

Jeg forventer ikke at det er mulig å beregne et snittt heller for NW/Prescott IPC forhold, siden det faktisk ikke vil eksistere! (ta den)

Har lest alt inkl. det du edit'a.

 

Det at matten ikke stemmer er korrekt dersom du skal regne nøyaktig på ting. Men siden et er umulig å regne nøyaktig så snakker vi hele tiden om omentrentligheter. (noe jeg har gitt uttrykk for hele veien) Det er derimot ikke umulig å si at lengre pipeline isolert sett gir lavere IPC og flere GHz. Det er ikke korrekt å trekke noen paralell mellom Opteron og P4 siden det er helt forskjellige arkitekturer med mange forskjellige teknikker for å gi bra ytelse. Det går heller ikke an å justere pipelinen som en eller annen "slider" i windows for å se ytelse-resultatet i form av MHz og IPC. Vi har få punkter å forholde oss til og ingen identiske arkitekturer med kun forskjell i lengden på pipeline. Matten vi sakker om er dermed ikke eksakt på noen måte, men det går likevel å trekke sluttninger ut fra hva som betyr noe for ytelse, IPS og GHz i positiv eller negativ retning. Det går også an å gjøre en del "guesstimates" basert på en rekke andre arkitekturer selv om det ikke er noen generell fasit på noen ting. Jeg heller ikke sagt at am kan regne noe eksakt på ytelsen mellom de to og dermed heller ikke noe eksakt gjennomsnittlig om ytelsen. Men det jeg har sagt er at det går an å lage et slags gjennomsnitt når vi bare får testet begge CPU'ene mot hverandre. Altså et eksakt gjennomsnitt for et stort utvalg tester, og altså et omentrentlig gjennomsnitt for generell ytelse.

 

Jeg er sikker på at noen kan klare å kverulere på dette også.. Men prøv nå å skjønn hva jeg mener i stedet for å bare kverulere og vri på ting.

Lenke til kommentar
Simen1: Du glemmer et viktig poeng her, nemlig at alt Intel rører blir til gull ;)

 

Alle andre blir bare som amatører å regne til sammenligning. Jeg tror jammen meg at det var Intel som oppfant hjulet også :wow:

Har du glemt Celeron? Fordi jeg vill ikke akuratt kalle den gull ;)

Når han sier "gull" mener han ikke nødvendigvis ytelsesmessig. Tror du ikke Intel tjener RÅTT på celeron ?

 

Mvh, Kim

Lenke til kommentar

Til de som de som tror at HT gir mye ytelses øning vil jeg ambefale denne testen:

http://www.hardware.no/tester/cpu/p4_3060/

 

Jepp, HT gir merkbar ytelses forbedring i 3 tester. Det var kanskje ikke noen bombe at den største ytelsesøkningen var i sisoft sandra (som har 0 å si for virkelig ytelse). Prescott skal ha en virkelig forbedring på dette feltet om Det skal ha noe å si for ytelsen under ett.

Lenke til kommentar
Du har foreløpig ignorert det viktigste. Se lengre opp.

 

Jeg forventer ikke at det er mulig å beregne et snittt heller for NW/Prescott IPC forhold, siden det faktisk ikke vil eksistere! (ta den)

Har lest alt inkl. det du edit'a.

 

Det at matten ikke stemmer er korrekt dersom du skal regne nøyaktig på ting. Men siden et er umulig å regne nøyaktig så snakker vi hele tiden om omentrentligheter. (noe jeg har gitt uttrykk for hele veien) Det er derimot ikke umulig å si at lengre pipeline isolert sett gir lavere IPC og flere GHz. Det er ikke korrekt å trekke noen paralell mellom Opteron og P4 siden det er helt forskjellige arkitekturer med mange forskjellige teknikker for å gi bra ytelse. Det går heller ikke an å justere pipelinen som en eller annen "slider" i windows for å se ytelse-resultatet i form av MHz og IPC. Vi har få punkter å forholde oss til og ingen identiske arkitekturer med kun forskjell i lengden på pipeline. Matten vi sakker om er dermed ikke eksakt på noen måte, men det går likevel å trekke sluttninger ut fra hva som betyr noe for ytelse, IPS og GHz i positiv eller negativ retning. Det går også an å gjøre en del "guesstimates" basert på en rekke andre arkitekturer selv om det ikke er noen generell fasit på noen ting. Jeg heller ikke sagt at am kan regne noe eksakt på ytelsen mellom de to og dermed heller ikke noe eksakt gjennomsnittlig om ytelsen. Men det jeg har sagt er at det går an å lage et slags gjennomsnitt når vi bare får testet begge CPU'ene mot hverandre. Altså et eksakt gjennomsnitt for et stort utvalg tester, og altså et omentrentlig gjennomsnitt for generell ytelse.

 

Jeg er sikker på at noen kan klare å kverulere på dette også.. Men prøv nå å skjønn hva jeg mener i stedet for å bare kverulere og vri på ting.

Som jeg sa tidligere. Matten er nøyaktig nok, men grunnlaget for matten er feil. Heller du 1 liter vann inn i et rør så kommer det ikke ut 9dl i andre enden om røret er 10% lengre (enn ett eller annet lotto tall), med mindre det skjer noe galt (mispredict). Da kommer det ikke noe ut i andre enden før det har gått (nx1,1)+k sykluser. der n er dette magiske "rette" pipeline tallet vi oppererer med, og k er en statistisk variabel som sier noe om hvor mange sykluser det tar å hente de data en behøver. k er typisk større enn n.

 

Å anta at en 10% lengre pipeline får noe i nærheten av 10% dårligere ytelse forutsetter en rekke umuligheter. 1) ALL informasjon må lige i L1 cache og 2) Det gjøres mispredict for HVER syklus. Teoretisk og hypotetisk sett. Dette høres unektelig tullete ut, men er altså dette du (sikkert uten å tenke over det) har lagt til grunn for beregningene.

 

Turgon: Den testen ble utført før det var særlig støtte for HT i sw. Det ser også ut til å bli en del endringer i HT på prescott. Bl.a. økning fra 3 til 4 issue ports, som gir en teoretisk økning på 33%. Største forbedrings potensialet er imidlertid i SMT kompatibel sw.

Endret av Knick Knack
Lenke til kommentar
Til de som de som tror at HT gir mye ytelses øning vil jeg ambefale denne testen:

http://www.hardware.no/tester/cpu/p4_3060/

 

Jepp, HT gir merkbar ytelses forbedring i 3 tester. Det var kanskje ikke noen bombe at den største ytelsesøkningen var i sisoft sandra (som har 0 å si for virkelig ytelse). Prescott skal ha en virkelig forbedring på dette feltet om Det skal ha noe å si for ytelsen under ett.

Og det var kanskje ingen bombe at det stod AMD i avataren din?

 

 

 

 

 

 

 

 

 

:ermm:

Hva har avataren min med det jeg skrev å gjøre? Letterlig komentar. Kan vel ikke noe for at jeg synes FX logoen er utrolig fet.

 

KnikkKnakk: Du har et godt poeng i det du sier, var bare jeg som ikke tenkte så langt. Et annet poeng er hvis man kjører to tunge aplikasjoner samtidig, vet ikke hvor ofte man gjør det, men da kan nok HT vise litt styrke.

Lenke til kommentar
Til de som de som tror at HT gir mye ytelses øning vil jeg ambefale denne testen:

http://www.hardware.no/tester/cpu/p4_3060/

HT kan gi en meget pen ytelsesøkning i visse tilfeller:

 

http://hardware.no/art.php?artikkelid=3301&side=4

 

Og JA, de tre tilfellene er "spesielt konstruert" for å vise fordelen med HT, men de er i det minste "real-life", hvilket man ikke kan si om alle tester.

Lenke til kommentar

Vedrørende forskjeller på arkitektur så er balansering også viktig, så derfor foreslår jeg at dere ser litt på dette:

http://www.beowulf.org/pipermail/beowulf/2...ber/008409.html

 

"This is a design area that favors the Opteron (and Power 4) because the memory controller is on-chip (unlike the Pentium 4 and I2) and as such, its performance improves with clock.

 

I think it is interesting to look at other processor's theoretical balance numbers in relationship to the I2's that you compute (I hope I have them all correct):

 

Pentium 4 EE 3.2 GHz:

(3.2 GHz * 2 flops * 24 bytes) / 6.4 bytes/sec = Balance of 24

(max on chip cache 2MB)

 

Itanium 2 1.5 GHz:

(1.5 GHz * 4 flops * 24 bytes) / 6.4 bytes/sec = Balance of 22.5

(max on chip cache 6MB)

 

Opteron 246 2.0 GHz:

(2.0 GHz * 2 flops * 24 bytes) / 6.4 bytes/sec = Balance of 15

(max on chip cache 1MB)

 

Power 4 1.7 GHz:

(1.7 GHz * 4 flops * 24 bytes) / 6.4 bytes/sec = Balance of 25.5*

(max on chip cache 1.44MB)

 

Cray X1 .8 GHz:

(0.8 GHz * 4 flops * 24 bytes) / 19.2 bytes/sec = Balance of 4

(512 byte off-chip L2)

 

* IBM memory performance is with 1 core disabled and may now be higher than this.

 

When viewed in context, yes, the I2 is poorly balanced, but it is typical of microprocessors, and it is not the worst among them. It also offers the largest compensating cache. Where it loses alot of ground is in the dual processor configuration. Opteron yields a better number, but this is because it can't do as many flops. The Cray X1 is has the most agressive design specs and yields a large enough percentage of peak to beat the fast clocked micros on vector code (leaving the ugly question of price aside). This is in part due to the more balanced design, but also due to its vector ISA which is just better at moving data from memory."

 

P4 EE er dårlig balansert som dere kan se, noe også P4E (Prescott) kommer til å bli... Opteron derimot :thumbup:

Lenke til kommentar
Simen1: Du glemmer et viktig poeng her, nemlig at alt Intel rører blir til gull ;)

 

Alle andre blir bare som amatører å regne til sammenligning. Jeg tror jammen meg at det var Intel som oppfant hjulet også :wow:

Har du glemt Celeron? Fordi jeg vill ikke akuratt kalle den gull ;)

Når han sier "gull" mener han ikke nødvendigvis ytelsesmessig. Tror du ikke Intel tjener RÅTT på celeron ?

 

Mvh, Kim

Hmmm.... Når du sier det på den måten så... Gull= Celeron for Intel

Men for den enkelte så blir Celeron aldri Gull :thumbdown:

Lenke til kommentar
Til de som de som tror at HT gir mye ytelses øning vil jeg ambefale denne testen:

http://www.hardware.no/tester/cpu/p4_3060/

HT kan gi en meget pen ytelsesøkning i visse tilfeller:

 

http://hardware.no/art.php?artikkelid=3301&side=4

 

Og JA, de tre tilfellene er "spesielt konstruert" for å vise fordelen med HT, men de er i det minste "real-life", hvilket man ikke kan si om alle tester.

seti testen kan ikke akkurat kalles real life, men de andre viser HTs styrke. Det som var mest intresant var comache med encoding i bakgrunn, hvor man ser at HT gir mye bedre ytelse. Zippeytelsen blir også mye bedre, no som selvsagt er kjempe positivt.

 

Men, hvor ofte kjører man egentlig encoding samtidig med at man spiller?

Det hadde også vært morsomt om man kunne se hvor mye ekstra tid encodingen tok også....

Lenke til kommentar
... seti testen kan ikke akkurat kalles real life ...

Hvorfor ikke? Det er jo mange som kjører Seti for fulle guffer på maskinene sine døgnet rundt. Om ikke i to tråder som kanskje i en tråd samtidig som det er ledig kapasitet i den andre tråden til andre oppgaver. For slike folk teller det ganske mye hvor mange Seti-pakker man klarer å krunsje i løpet av en dag..

 

PS: Jeg er Seti-fan og lar Seti kjøre når jeg ikke bruker PC'n. (bortsett fra på sommeren for da er det varmt nok på rommet mittt som det er.)

Lenke til kommentar

Vel, for de som synes det er seti@home er et morsomt prosjekt, er jo den ekstra ytelsen høyst aktuell..

 

Hvor ofte man kjører encoding i bakgrunnen? Hvis maskinen skal stå og kverne på noen som tar en dags tid, så er det klart at man ofte vil ønske og gjøre andre cpu-intensive ting samtidig. Ikke nødvendigvis spilling, men det finnes mange andre krevende ting, som f.eks. kabal o.l. ;)

Lenke til kommentar
Dette kan da ikke stemme. Intel kan umulig ha gjort pipen` enda lengre.

Jeg må bare trekke frem denne fra første side, fordi den gikk tydeligvis over hodet på de fleste. (i defence mode)

 

Noen sa "pipen fikk en annen låt", og han svarte med "pipen ikke lengre".

 

Til de som de som tror at HT gir mye ytelses øning vil jeg ambefale denne testen:

http://www.hardware.no/tester/cpu/p4_3060/

Nå var jo ikke hw.no verdensmestere i å teste ting med flere prosessorer på den tiden.

 

 

Men, hvor ofte kjører man egentlig encoding samtidig med at man spiller?

Det hadde også vært morsomt om man kunne se hvor mye ekstra tid encodingen tok også....

Det samme spurte jeg meg selv for et halvt år siden, men jeg gjør det faktisk hele tiden nå. Når du driver med en jobb som tar en time eller tre, så er det greit å kunne bevege musepekeren eller tilogmed spille et spill, noe som single maskinen ikke er særlig glad i.

Lenke til kommentar
Men, hvor ofte kjører man egentlig encoding samtidig med at man spiller?

Det hadde også vært morsomt om man kunne se hvor mye ekstra tid encodingen tok også....

Vedrørende video-enkoding, så er denne testen hos Digit Life meget interessant:

http://www.digit-life.com/articles2/intela...ideo/index.html

 

AMD-prosessorer er raskest på XviD, mens Intel-prosessorer er raskest på DivX5 Pro...

Endret av snorreh
Lenke til kommentar
Det som er skummelt er hvor bra Celeron gjør det.

Tja, den ligger på nedre del i nesten alle testene her da. Mest interessant var likevel det at Athlon XP 2200+ er raskere enn P4 3.2GHz på XviD... :yes:

Stemmer det? Utrolig. Det viser egentlig hvor avhengi p4 er av optimaliserte programmer.

Lenke til kommentar

Prescott 2.8 vs Northwood 2.8 er ute:

http://www.computerdiy.com.tw/modules/news...php?storyid=108

 

siden laster ekstremt seint

 

I følge den så har prescott 20 steg pipeline, men det er ikke sikkert dette er god fisk.

 

Testresultatene er noe sære. Varierer fra -15% til +190% (Prescott/NW)

 

Edit: kanskje denne er kjappere:http://www.computerdiy.com.tw/data/victor/...ult%20table.jpg

Endret av Knick Knack
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...