Gå til innhold

Bob Ibsen

Medlemmer
  • Innlegg

    1 104
  • Ble med

  • Besøkte siden sist

Innlegg skrevet av Bob Ibsen

  1. trodde det var så at ultra/sli var like som 2 dråper vann med unntak av sli ?

    Det stemmer. nForce4 Ultra og SLI har begge native support for fire SATA-kanaler. Skal det implementeres flere kanaler må det benyttes tilleggskontrollere. Kan forøvrig ikke se at noen her påstår det motsatte - hva Dragavon mente var vel at SLI-modellene ofte har ekstra SATA-kontroller i tillegg?

  2. Diskusjoner rundt stabilitetsproblemer hører fortiden til, spør du meg. I tidlige socket A-tider var nok Intel betydelig stødigere plattformer, men dette er ikke lenger noe man trenger å tenke på. Valgene bør tas på bakgrunn av andre faktorer.

     

    Jeg anbefaler X2 3800+

  3. "Teknologisk" sett.. og ytelse "overall" er vi vel alle enige i at en X2. .gjerne 3800+ er rett valg... :)

    Øh, nei, egentlig ikke. Siden det er så liten og synbar forskjell i spill, i praksis mellom AMD og Intel, så mener jeg at Intel er bedre fordi det ligger et par he

    tehoder foran når det gjelder heavy multitasking.

    Endeli noen som har skjønt det...

     

    Har testa amd a64 3000+ og min P4, det er forskjell på multitasking.

    Serlig om du fyrer i gang winrar og et spill sammtidig...

    :hmm:

     

    TL1000S mener altså at en X2 3800+ (som er dualcore) er et bra kompromiss mellom pris og ytelse, spesielt med tanke på multitasking. ahpadt følger opp med å slå et slag for Intel dualcore.

     

     

    Så har jeg et spørsmål til deg, tbend:

     

    Om du er skeptisk til AMDs multitasking så greit nok, men hvorfor trekker du inn en singlecore 3000+ i denne sammenhengen?

  4. Har nå kjørt memtest86 i en time.. 0 feil på 245mhz... men i superpi for jeg error med en gang: "not exsact in round"... Hva er dette for noe? Jeg vet at en time i memtest86 er for lite, men det var jo litt rart syntes jeg....

    Jeg opplever akkurat det samme. Memtest er stabilt på rundt 240 MHz (BH-5-minne), og jeg vet at prosessoren er stabil. Men for at Superpi skal passere må jeg redusere minnet til kanskje 232 MHz... Alt annet enn superpi kjører uproblematisk, men jeg er etterhvert blitt temmelig kresen på stabiliteten, derfor tilpasser jeg spesifikasjonene etter "worst-case", selv om det kanskje ikke er nødvendig.

  5. Jeg betalte 1950kr :)

    Nice pris!

    Synes du virkelig det? Man må jo ikke betale så veldig mye mer for et glimrende 2x1GB-sett. Jeg sier ikke at det er dyrt i forhold til hva BH-5, eller for den saks skyld TCCD bruker å ligge på, men helhetlig sett mener jeg at 512-brikker har tapt ganske mye terreng etterhvert.

  6. Først: Utrolig god og informativ tråd :thumbup:

    Edit: Jeg tillot meg å lage en samletråd over nyttige tråder om CPU'er og startet med å hedre din tråd: Annonsering: Nyttig lærdom om CPU'er.

     

    Minnebåndbredden er også noe folk har hypet veldig mye opp. Moteordet "dual channel" har tydligvis mye mer slagkraft på kjøpere enn den reelle ytelseforskjellen. Jeg gjorde en tilsvarende sammenligning som du har gjort her med enkelt kanal minne og og doble minnekanaler og fant ut at gjennomsnittlig ytelseforskjell var ca 3%. Dette er sikkert også tall som de fleste vil bli overrasket over.

    Takk :)

     

    Jeg hadde også en tråd som sammenligner single -versus dualchannel her.

     

    Eneste virkelige forskjellen er i båndbredden, som jo isolert sett er svært lite interessant. Skal man måle ytelse på biler, er det jo mer enn antall hestekrefter som betyr noe. Noen biler veier jo f.eks. mer enn andre, og i sammenhengen minnebåndbredde og L2-størrelse er det utvilsomt Intel-systemer som "veier mest"...

  7. Alle AMD revisjon E-prosessorer har en "innprentet" temperatur-rating, såkalt Max TCase. Dette baseres trolig på en vurdering av hvor "robuste" hvert eksemplar er, og det virker vel ikke direkte ulogisk at en høy verdi jevnt over betyr bedre klokking?

     

    Medlemmer på OCforums og XS har begynt å samle opp data for å se om det er en sammenheng mellom denne ratingen, og prosessorenes klokkepotensiale. Selv om dette bare er i startfasen, er det ting som tyder på at det kan være noe i dette...

     

    Man laster ned et lite program, som viser denne ratingen. Tallene varierer innenfor samme serie og PR-rating.

     

    Dette fungerer for følgende serier:

     

    Venice A64

    San Diego A64

    San Diego A64 FX

    Toledo A64 X2

    Machester A64 X2

    Rev E Opterons

     

    http://www.xtremesystems.org/forums/showth...light=max+tcase

     

    http://www.ocforums.com/showthread.php?t=404115&page=1&pp=30

  8. Nå har ikke jeg sett på hvordan L3 cachen direkte opererer, men gjelder fortsat ikke snoop, snarf osv. samt branch predicaments for all cache? Og siden cache er onboard, ergo eliminerer NB tid/latency, burde det vel uansett bli raskere å sjekke opp om L3 har data CPU ber om?

    Mye av poenget er at størrelsen på L3 måtte ha vært uforholdsmessig stor for å ha noen positiv effekt. Fordi L2 overlapper innholdet i L1 er det viktig med en kraftig økning i størrelsen for hvert nivå man legger til i inkluderende cacher (som Simen1 forklarte). Hvis ikke vil det bare bli lengre vei til minnet, uten at man får utbytte av noe særlig ekstra data. Når samme informasjon speiles i flere nivåer, går det naturlig nok på bekostning av effektiv lagringsplass. Men ja, hvis vi tenker oss at denne CPUen hadde L3, og de forespurte dataene fantes der, ville det fortsatt være mye raskere enn å gå via RAM.

     

    Jeg er usikker på i hvilken grad data prefetches til L2 på disse prosessorene, men i hovedsak vil nok nivået/nivåene under L1 lagre data som allerede har vært innom L1, og blitt evicted derfra (i tillegg til de konstante oppdateringene til L2 og RAM, som kommer uavhengig av evictions). De nedre nivåene fungerer i så fall som en slags backup i tilfelle "gamle" data blir forespurt på nytt. Jeg ser ikke hva branch prediction skal ha med antallet cachenivåer å gjøre, men ved en misprediction vil det (som alltid) være en fordel å ha de relevante dataene nærmest mulig prosessoren.

     

    Ta en titt i denne tråden for en enkel forklaring på forskjellene mellom inkluderende og ekskluderende cacher.

     

    Samt at etterhva jeg har lest er L1 cache på Intel sine CPU'er 1-way, samt ikke "unified" med L2, mens eksisterer L3 cache er denne sammen med L2 (Altså, L1, L2+L3)

    Samt at L3 cache i utgangspunktet kun skulle brukes for å eliminere (Så godt som mulig) evt. overhead med HyperThreading.

    Cachene i alle dagens Intel-prosessorer, dvs Pentium 4 og Pentium M har inkluderende L1/L2-relasjon. Den effektive kapasiteten er alltid tilsvarende det største nivået i disse prosessorene, enten de har to eller flere nivåer.

     

    Angående eliminering av overhead i forbindelse med HT skjønner jeg ikke hva du mener.

     

    1-way? Tenker du på associativity? Det kalles direct-mapped og brukes ikke på noen av Intels eller AMDs prosessorer idag. Jeg vil tippe at denne har 8-way set associativity - Prescott med 1MB har ihvertfall det på både L1-D, L1 Trace og L2.

  9. Adapter-løsningen er bedre enn rene socket 479-hovedkort, men denne passer bare på enkelte ASUS-kort. Man må også flashe inn kompatibel BIOS, noe som kan bli vanskelig hvis man ikke har en vanlig 478-desktop prosessor.

     

    Det er ingen som kan gi noe sikkert overslag over hvor langt du kan klokke - det kommer an på så mangt. To eksemplarer med akkurat samme modell-nummer kan være vidt forskjellige.

     

    Her finner du alt du trenger:

    http://www.xtremesystems.org/forums/showthread.php?t=62366

  10. Forstår overklokking av cpu. men hvr viktig er overklokking av minne for å øke "kicket" i systemet. og hvilke rolle spiller timings her i det systemet jeg skal ha?

    Minneytelsen blir et mer sentralt tema når man har en dualcore, ettersom begge kjernene deler den samme minnebussen. Timings har en viss betydning for AMD-systemer, men disse forskjellene blir neppe merkbare. Det fine med å kjøpe 2GB, er at kvalitetsminne er forholdsvis rimelig, så jeg mener det er verdt å legge på litt ekstra om man skal overklokke. På den andre siden er ikke raskt minne noen forutsetning for å overklokke prosessoren.

     

    Patriot-minnet du linker til er meget bra. Men disse brikkene er billig-utgavene av Ballistix-serien som nok er de aller beste 1GB-modulene for AMD64 (benytter samme chiper).

     

    Sjekk denne OC-databasen - ingen tvil om at Crucial med Micron -5B D-chiper dominerer:

     

    http://www.xtremesystems.org/forums/showthread.php?t=67762

  11. Svært så lang tid det tar før den kommer da!

    Som det vel ble nevnt i en tidligere tråd vi deltok i, har de vært i produksjon en god stund, men er foreløpig kun tilgjengelige for ferdig-PCer :(

     

    Disse prosessorene kommer ikke til å stå mye tilbake for S939 singlecore-CPUer, det er jeg sikker på. Spenningsmomentet ligger vel først og fremst i prisen, og tidspunktet for tilgjengelighet (for løssalg).

     

    Av nåværende modeller finnes to med 9x multi, og to med 10x, og begge hastigheter kommer med L2-størrelser på 128 -og 256kB. Cachereduksjonen gir et minimalt ytelsestap sammenlignet med Venice. Det samme gjelder 1600MT HyperTransport.

     

    Utgavene som kom i august har sannsynligvis SSE3 og x86-64. Dualchannel er naturlig nok også på plass.

     

     

    Jeg trodde forøvrig dette var en helt ny tråd da jeg så den (håpet et lite øyeblikk at de allerede var tilgjengelige)... :p

     

     

    SuperPi 32M-stabil Sempron @ 2,7 GHz / 1,45 vCore!

  12. Mener å huske at Simen1 sa at cachen generelt bare står for noe få prosent av en prosessors varmeutvikling.

     

    Edit: Pentium M benytter også "quadrant selector", som innebærer at bare en fjerdedel av L2 aktiveres ved hver fetch, istedenfor at hele nivået aktiveres, som på desktop-CPUer. Dette er en strømsparefunksjon, som følgelig også bør redusere varmeutviklingen.

  13. Spenningen må tilpasses klokkefrekvensen man kjører på i øyeblikket, og bør altså hverken være for høy eller for lav. Et eksempel fikk jeg se da jeg modifiserte vDIMM til 3,42 (fastlåst) på et gammelt hovedkort. Jeg måtte holde meg like over 240 MHz - noe få MHz opp eller ned så haglet det på med feil i memtest. Det er bare å prøve seg frem.

  14. Angående størrelsesforholdet mellom cachenivåene poster jeg her et utdrag fra en tråd jeg hadde for en tid tilbake. Den bruker Pentium 4 og AMD-prosessorer som sammenligningsgrunnlag, men forskjellene som kommer pga L1/L2-relasjonen (om cachene er inkluderende eller ekskluderende) er gyldig for alle prosessorer som har to eller flere nivåer. Poenget er at man ikke kan konkludere med at "L1 er for liten", eller noe i den dur, uten å forstå hvordan disse tingene henger sammen.

     

    Pentium M benytter samme forhold som Pentium 4, men en forskjell er at minnet ikke oppdateres kontinuerlig på P-M, slik det gjør på P4.

     

     

    Pentium 4:

     

    På en Pentium4 har L1 og L2 en dupliserende eller inkluderende relasjon - det betyr at alle ferdigbehandlede data som skrives fra registrene til L1, umiddelbart kopieres til L2 og RAM i tillegg. Det inkluderende cache-forholdet resulterer altså i at alle data som er i L1 også finnes i L2, og det reduserer den effektive lagringskapasiteten til cachene i sin helhet. Omtrent som en bok hvor noen av de samme setningene forekom på to steder - de ville ikke akkurat utgjøre noen ekstra informasjon. Å tilføre L3-cache med samme størrelse og arkitektur som L2 ville i denne sammenhengen vært udelt negativt. Det ville bare gjøre veien til minnet lengre (mer å søke igjennom), uten å bidra med noen nye data overhodet. Jo mindre størrelsesforskjellen imellom nivåene er, jo høyere er andelen av tapt *effektiv* lagringskapasitet. Derfor det være et visst størrelsesforhold imellom L1 og L2 i dupliserende cacher. Intels løsning har vært å lage en liten L1, som til gjengjeld har svært lav søketid. Den høye klokkefrekvensen bidrar også til at L1 ikke blir et særlig stort hinder på veien til L2, som er en veldig kritisk faktor for Pentium 4. L2-mengden må være stor for å kompensere for den lille L1-cachen - ellers ville ikke cachene være i stand til å imøtekomme en stor nok andel av prosessorens forespørsler.

     

    Den største fordelen til inkluderende cacher er følgende: Gjennomgående oppdatering innebærer at alle datablokker i cachen kan overskrives umiddelbart - det er ikke nødvendig å ta backup av gamle data i L1 før nye blokker hentes inn fordi dataene allerede er trygt forvart i både L2 og RAM.

     

     

     

    AMD K7 og K8:

     

    AMD-prosessorer bruker en ekskluderende cache-relasjon, som altså er det stikk motsatte av inkluderende. Her hentes data fra RAM til L1, og blir ikke skrevet tilbake til L2 før det er nødvendig av plass -eller konfliktshensyn. Vi kan se for oss at vi åpner en vannkran (data fra CPU), og plasserer et lite beger under den (L1 cache). Så har vi et ekstra beger under der igjen (L2 cache). Med visse forbehold og forenklinger kan vi si at L2 først vil få en aktiv rolle når det øverste begeret blir fullt og renner over. L2 vil da "samle opp" vannet i tilfelle det blir etterlyst senere - og i så fall må vi tømme de forespurte vannmolekylene tilbake i L1-begeret igjen :)

     

    En ulempe med ekskluderende cache er at det krever en ekstra oppdatering idet en L1-miss inntreffer. Hvis det aktuelle området er opptatt må dataene vike plassen (eviction) og tas backup av før cachen kan oppdateres med de nye dataene. Derfor bruker AMD en victim buffer, som er en liten cache imellom L1 og L2. Data kan kopieres til denne samtidig som en forespørsel passerer videre til L2 (og eventuelt RAM), istedenfor å måtte flytte dem til L2 ved hver eneste L1-miss. Dette bidrar sterkt til å redusere ulempen ved ekskluderende forhold, uten at det eliminerer den. Når victim bufferen er full, må den nemlig kopieres til L2, og kapasiteten er så vidt jeg vet på bare åtte cachelinjer, eller 512 byte. Når victim bufferen må tømmes koster det åtte klokkesykluser, så dette hemmer effektiviteten til L2, om ikke dramatisk.

     

    Fordelen med ekskluderende cache er først og fremst at det tillater en helt annen størrelse på L1, fordi L2 ikke "kaster bort" plass på å overlappe L1. Dette er en løsning som AMD har brukt i en årrekke, og den gir mye bedre fleksibilitet enn inkluderende relasjon fordi cachenivåenes størrelser ikke er "bundet" av hverandre. L2-cachen kan til og med være mindre enn L1 under denne arkitekturen, noe som faktisk er tilfelle med K7 Duron (128kB L1/64kB L2). L1 kan allerede romme så mye data at verdien av L2 blir neglisjerbar. Ekskluderende cacher gir dermed bedre muligheter for å skape en hel CPU-serie som yter nesten like bra over hele linja (det er alltid noen eksemplarer med delvis defekt cache). Den integrerte minnekontrolleren er også noe som bidrar til at cachestørrelsen blir mindre avgjørende for AMD, men de påfølgende grafene demonstrerer ikke dette siden de kun baseres på AMD K8-prosessorer.

     

     

    http://forum.hardware.no/index.php?showtopic=468318&hl=

  15. Tre brikker anbefales ikke, uansett størrelse. Enten to eller fire like store brikker er det beste - det gir både balansert bank-interleaving og dualchannel.

     

    Jeg vil egentlig ikke si at dette kortet er kresen på RAM, men samtidig er det ingen tvil om at BIOSene må bli mer modne før vi (eventuelt) får se det fulle potensialet. Noen innstillinger slår ikke inn, f.eks. om man velger 1 i W/R-delay blir den satt til 2, osv.

     

    Det verste med dette kortet er i mine øyne at insert-trikset ikke funker, og at det har cold-boot-bug (vDIMM starter på 2,6 uansett, derfor er det ofte problematisk å få start når man bruker overklokket winbond-minne).

     

     

    BTW, jeg tror det vil være mulig å gi inntil 4,0 v på dette hovedkortet vha en ganske enkel mod, og modifisert BIOS. Dette fungerer på socket 754-utgaven, og MOS-FETene til minnekretsen er så langt jeg kan se de samme på dette kortet (Q38 og Q50). Dette blir jeg ihvertfall å holde øynene åpne for, men problemet er at dette kortet neppe blir å "ta av" når det gjelder oppslutning fra entusiaster. NF4-serien er nok altfor etablert til at dette NF3-kortet vil få særlig oppmerksomhet fra f.eks. BIOS-moddere - men det er lov å håpe...

  16. Hvis BIOS ikke finner skjermkort, er det en egen pipekode for dette, men man hører bare en kode om gangen. Minnefeil står høyere på "prioritetslisten", slik at hvis maskinen mangler både minne og skjermkort (eventuelt begge deler er defekte) vil man høre koden som indikerer minnefeil. Jeg vet ikke hvorfor det tar lengre tid før pipingen kommer, men ser ikke at det i seg selv er noen grunn til bekymring. Hvordan kanalene fordeles imellom slotene varierer, men ingenting blir å gå galt ihvertfall. Det verste som kan skje er at maskinen ikke starter.

×
×
  • Opprett ny...