Gå til innhold

Anbefalte innlegg

Den overlevde og sto i folding inntil jeg trappet ned. Det eneste av hardware i den riggen som ikke klarte seg såvidt jeg husker var 4 minnebrikker som ble ustabile og måtte kasseres.

Jeg har akkurat skiftet minne på en PC og det passet kanskje bra fordi den noen ganger stoppet uforklarlig, jeg skal teste det minnet som ble tatt ut ved neste anledning. Men foreløbig går iallfall denne bra med nytt minne. Kan det tenkes at minnefeil fører til stans uten noen logmeldinger og ingen blåskjerm?

Når jeg prøver å kjøre 6.29 på den ene maskina så stopper den med Segmentation fault når den prøver å kontakte server. Dette synes ikke i loggen, kun når jeg kjører den manuelt. På foldingforum ble det foreslått at dette kunne skyldes dårlig ram. Desverre så var det ikke noe feil med ramen, men segmentation fault kan skyldes en hver form for skrive/lesefeil (kan også skyldes cache-feil i CPU eller feil på Harddisk).

 

Så ja, ram-feil kan få ting til å stoppe uten at det synes i loggen eller at systemet kneler totalt.

Lenke til kommentar
Videoannonse
Annonse

Når jeg prøver å kjøre 6.29 ....På foldingforum ble det foreslått at dette kunne skyldes dårlig ram. Desverre så var det ikke noe feil med ramen, men segmentation fault kan skyldes en hver form for skrive/lesefeil (kan også skyldes cache-feil i CPU eller feil på Harddisk).

 

Så ja, ram-feil kan få ting til å stoppe uten at det synes i loggen eller at systemet kneler totalt.

Takk for svar. Det er mitt inntrykk at det bare skjer når jeg kjører nettopp 6.29 på to av maskinene Hadde jo ikke vært så ille om det bare var to SMPer men da stopper jo noen GPUer også. Nå har som nevnt denne gått uklanderlig ett par døgn så det virker iallfall bedre med nytt minne om det nå ikke skulle være hovedårsaken. Burde kanskje nevne at de kjørte fint i måneder med SMP 5.91.

Endret av kjellms
Lenke til kommentar
Desverre så var det ikke noe feil med ramen,

Antar det er memtest du sjekket den med?

 

Jeg har opplevd å ha en minnemodul som memtest ikke fant noen feil på, men som tydeligvis hadde det allikevel siden disse "uforklarlige" problemene jeg da hadde forsvant (spill og installasjoner som feilet "usystematisk"; torrenter som seedet ble plutselig korrupte; tilfeldige WU'er ble plutselig korrupte; osv).

Lenke til kommentar

Kjørte du da memtest i eller utenfor OSet? Hvis man kjører memtest i OSet er det delere av ramen som er bunnet opp og man ikke får testet. Linux har gjerne memtest som et av valgene ved boot. Jeg kjørte denne i maaange timer (over 9 komplette gjennomkjøringer) uten feil.

 

Men jeg har planer om å bytte ut ramen på denne maskina.

Endret av Xell
Lenke til kommentar

 Hvor mye er komplett da? Og kan det tenkes at folding stresser minnet mer enn Memtest?  :hmm:

 

Når man kjører memtest så gjøres les og skriv operasjoner til minnet konstant, det gjøres ikke i FaH der en del av operasjonene aldri kommer lenger en til cache. Så har man klokket minnet så hardt at det går varmt og feiler av den grunn vil memtest med stor sannsynlighet finne feilen relativt raskt.

 

På i7 maskina brukte jeg memtest for å teste når jeg klokket og da fikk jeg feil i løpet av kort tid når minnet var klokket for hardt. Men det tror jeg gikk mer på for harde klokkekrav enn varme.

 

Når det gjelder "hva er komplett"; når man starter memtest vil den kjøre en standardtest (man kan velge andre) som kjører gjennom ganske mange forskjellige skriv/les-operasjoner (forskjellige mønstere skrives til hele rambrikken og leses tilbake). Hvor lang tid en slik test bruker på å kjøre gjennom alle mønsterene kommer ann på hvor raskt minnet er, fra halvtimes tid på nye maskiner til flere timer på eldere maskiner. For å være helt sikker på feilfritt minne så bør man kjøre gjennom testen flere ganger. Memtest styrer dette av seg selv og fører opp log på skjermen hvor mange ganger den har kjørt testten og eventuelle feil, så det er bare å gå å legge seg (eventuelt dra på jobb) og la testen gå sin gang.

Lenke til kommentar

Ja, det høres jo fornuftig ut. Men da er det kanskje ikke tenkelig at FAH klarer å felle uklokket minne (altså ikke overklokket i forhold til specs)?

 

Noen ganger har det rausa på med røde tall med en gang. Da er det jo ikke tvil. Men det har hendt at jeg med noen få (kanskje to) timers kjøring ikke har funnet feil, og allikvel har mistanke om at noe kan være feil med minnebehandling. Kan det tenkes at når man kjører alt annet for fullt så blir det litt varmere i kabinettet og da øker sannsynlighet for feil? Eller at en kombinasjon av kodene som gir feil er så sjeldne at det tar tid å finne den. Men hvorfor maskina eventuelt skal stoppe fordi den gir regnefeil i 6.29 SMP og ikke i SMP 5.91 er ikke så lett å fatte. (Men data er jo rart!). Den burde jo bare gi en melding a la Nans detected el lignenede.

 

Så anbefalingen er altså at man skal kjøre memtest gjerne hel natta, problemet er at det er vanskelig å velge dette framfor å starte foldinga igjen! :cry:

Endret av kjellms
Lenke til kommentar

Hvis ting feiler en del så burde man jo ikke kjøre folding før man har funnet ut av feilen.

 

Grunnen til at man bør kjøre gjennom hele natta (flere run) er at ved ustabiliteter så er det ikke sikkert at feilen er synlig på hver gjennomkjøring av testen.

 

i875-big.gif

 

Pass i raporten (nederst med Walltime - Cached - RsvdMem osv) viser hvor mange ganger testen har kjørt gjennom alle testmønsterene. Man bør over 5 på Pass uten feil for å være trygg på at minnet er stabilt.

 

Når det gjelder FaH GPU så blir jo ting med en gang mer komplisert enn bare å kjøre memtest.

Lenke til kommentar

Ja, :cry: eller jeg gå tilbake til 5.91 på de som trøbler.

 

ED.: Når jeg tenker meg har jeg vel kjørt 5 pass mange ganger. Og når det er feil rauser jo feilene på med en gang. Den ene kjørte jeg sju på i går, alt godkjent, så da er det mest sannsynlig noe annet enn minnet. Me er ikke så bombesikker. Det kan være noe annet, kanskje noe med hovedkortet. Skal kjøre en test på denne også neste gang den stopper, tipper at jeg ikke finner minnefeil, skulle være rart om to par brikker skulle oppføre seg likt (ha samme feil mener jeg) rett etter hverandre.

 

ED2 Idag 28.02. hadde den tydeligvis stått å stanget på en 6023 i flere timer, ingen progresjon. Da kjørte jeg Memtest noen pass også noe sisoft sandra mens den foldet. Neppe noe minnefeil.

 

 

Endret av kjellms
Lenke til kommentar

Det blir spennende å teste GPU3 klienten når den endelig kommer.

 

Lite nytt om den i det siste. 13 januar lød budskapet i slutten av januar. Dagen etter ble følgende skrevet (VP):

 

I want to make it clear that we're seeing problems in both of our ATI and NVIDIA GPU OpenCL implementations for OpenMM.

 

Siden har det vært stille. Slutten av januar er snart begynnelsen av mars.

Lenke til kommentar

Kjørte du da memtest i eller utenfor OSet?

Kjørte utenfor OS. Brukte en Gentoo dvd som har memtest86 som et valg ved boot.

Mener også å huske at jeg lot den kjøre hele natta. Men jeg tror det var et sært tilfelle jeg hadde. For memtest fant ingen feil når jeg testet med begge modulene installert, men jeg lurer på om den ikke fant noe når jeg testet én og én... men jeg husker ikke nøyaktig.

Lenke til kommentar

Er det fler som har problemer med Fah klientene og Windows 7 64-bit?

 

Hadde endelig fått opp maskina mi igjen og la inn fah klient for cpu og gpu, det gikk 20sekunder og jeg fikk bluescreen og reboot.

 

Stoppet gpu klienten og kjørte kun cpu klienten. Da gikk det ca 2minutter så bluescreen og reboot.

 

Nå er begge slettet intill videre. Virker ikke som om det er 64-bits software tilgjengelig heller, eller dvs jeg klarer ikke å finne det ihvertfall.

Lenke til kommentar
Er det fler som har problemer med Fah klientene og Windows 7 64-bit?

 

Ja, ikke BSOD , men ustabil maskin/stopper/sender ikke.

 

Men vi/de/her inne trur det er forlite strøm, selv om jeg har 1500w PSU.

Er da snakk om 295 x2

Skal teste med 2x PSUer for å utelukke.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...