Le indagini iniziano sulla parte più visibilmente cambiata dell'architettura del Nehalem: la gestione delle memorie. Il Nehalm implementa una gestione molto simile a quella del suo diretto concorrente Phenom che consiste in una piccola, veloce cache L1 e L2 per ognuno dei suoi quattro core e quindi un'unica, grande cache L3 condivisa tra tutti i core.
La cache L1 del Nehalem sembra essere leggermente cambiata dalla versione attualmente montata sul Penryn, è infatti aumentata come latenza; ora utilizza 4 cicli di clock per l'accesso contro i tre necessari del penryn. La cache L2 ora ha solo 256Kb per core invece della cache 24 volte maggiore del Penryn in modo tale da essere molto più veloce ed aver bisogno quindi di soli 11 cicli contro i 15.
CPU / CPU-Z Latency | L1 Cache | L2 Cache | L3 Cache |
Nehalem (2.66GHz) | 4 cycles | 11 cycles | 39 cycles |
Core 2 Quad Q9450 - Penryn - (2.66GHz) | 3 cycles | 15 cycles | N/A |
La cache L3 è la più impressionante, ha bisogno di ben 39 cicli di clock per l'accesso a 2.66GHz, ha una grandezza di 8MB - volte la dimensione della L3 del Phenom, e ha un tempo di accesso molto pù veloce del processore di ATI/AMD. Nei test affrontati da Anandtech la cache del Phenom impiega circa 21.5 ns per dare una risposta, mentre la cache del Nehalem ne impiega circa 14.6 ns - quasi il 50% di tempo in meno!
L'introduzione della gestione delle memorie DDR3 nel die del processore è la novità più eclatante di questo nuovo chip. AMD ha utilizzato questa tecnica sin dal 2003, dall'uscita dei suoi primi processori K8 e per anni Intel ha resistito nel non fare altrettanto.
Con l'aumento della velocità dei clock e l'aumento dei Core è arrivato anche il momento di chiudere quel gap dato dalla gestione delle memorie. Possiamo già dire che il Nehalem è stato studiato per minimizzare la distanza tra i singoli core della CPU e la memoria principale grazie alla cache creata a posta.
I test di banda passante sono stati effettuati con la seconda piattaforma (con un Nehalem a 2.93GHz e memorie DDR3-1066) poichè la prima aveva - come già preannunciato - grossi bug con la gestione delle memorie:
CPU / Everest Ultimate 4.50 | Memory Read | Memory Write | Memory Copy | Memory Latency |
Nehalem (2.93GHz) | 13.1 GB/s | 12.7 GB/s | 12.0 GB/s | 46.9 ns |
Core 2 Extreme QX9650 - Penryn - (3.00GHz) | 7.6 GB/s | 7.1 GB/s | 6.9 GB/s | 66.7 ns |
Da questi test possiamo vedere come il Nehalem impiegi 2/3 del tempo che serve al Penryn per completare il test, e si pensa che il memory controller DDR3 del Nehalem sia molto più veloce della versione per DDR2 del Phenom.
La banda passante è ovviamente più grande con tre canali DDR3, everest ha misurato un incremento di circa il 70% in lettura. L'aumento di prestazioni con WinRAR si attesta invece sul 10% - tra il test in single e triple channel.