En SM er det nærmeste du kommer en prosessorkjerne i en Nvidia-GPU. 4090 har 128 SM-er, 4080 Super har 82. Hver SM kan utføre et gitt antall FP32-operasjoner per sekund (derfor måles GPU-er ofte i antall FLOPS).
I tidligere generasjoner (20-serien og bakover) var det slik at antall SM-er ganget med klokkefrekvens var en veldig god ytelsesindikator per generasjon. Hvis antallet SM-er doblet seg, pleide også ytelsen å doble seg. Det stemmer også relativt greit med 30-serien. Man skulle tro at 4090 var 128/82 = 1.6 ganger ytelsen til et 4080 Super, det er ikke i nærheten av å være sant.
Hver gang spillet skal tegne en 3D-modell, "male" teksturer, og beregne lys, må en SM gjøre dette. Det aller meste kan utføres parallelt, og av flere SM-er hvis det er nok piksler å regne ut. Problemet oppstår hvis det ikke er nok oppgaver for hver SM å holde på med samtidig, da vil noen av SM-ene stå i ro og gjøre ingenting.
Grunnen til at 4090 ikke er spesielt mye bedre enn 4080 Super på "lave" oppløsninger er fordi mange av oppgavene ikke lar seg fordele ut over flere SM-er. Store deler av GPU-en blir dermed stående og tvinne tommeltotter i vent på å få gjøre noe. På høyere oppløsning blir det flere piksler å regne på, som lar større andel av GPU-en jobbe samtidig.