Panoramica sui nuovi processori per notebook Intel Sandy Bridge e sulle nuove tecnologie che introducono nel segmento del mobile computing.
La nuova micro-architettura Sandy Bridge, presentata da Intel in occasione del CES di Las Vegas agli inizi del 2011 e basata su processo produttivo a 32 nm, va a sostituire la micro-architettura Nehalem a 45 nanometri o più precisamente la sua evoluzione Westmere, che era già passata a un processo litografico a 32 nm, soluzioni che ci hanno accompagnato con le CPU Core i3, i5 ed i7 negli ultimi due anni. Ricordiamo infatti brevemente che a partire dal 2006, con l'avvento della micro-architettura Core che ha seguito quella NetBurst, i vertici Intel hanno diciso di rinnovare l'architettura ogni anno per assecondare la famosa legge di Moore che prevede un raddoppio della potenza di calcolo a ogni nuova generazione. Per fare questo hanno introdotto una cadenza chiamata "Tick Tock" in cui i Tock indicano il cambio di architettura, intervallati dai Tick che prevedono invece un semplice die shrinking tramite passaggio a un processo produttivo più miniaturizzato.
I processori Sandy Bridge per notebook
Intel ha presentato numerosi processori sempre divisi nelle 3 famiglie, Core i3, i5 ed i7, come per i processori Nehalem (nomi in codice Arrandale e Clarksfield), ma ora con un processor number a 4 cifre e non più a 3.
Per il settore notebook avremo:
Gli i7 pensati per la fascia alta del mercato ed equipaggiati con 4-2 core fisici;
Gli i5 pensati per i notebook mainstream ed equipaggiati con 2 core fisici;
Gli i3 destinati al segmento entry-level ed equipaggiati con 2 core fisici.
Tutte queste CPU inoltre, grazie alla presenza della tecnologia HyperThreading, permetteranno l’esecuzione di un numero doppio di thread rispetto al numero di core fisici di cui sono dotate.
Segue la lista delle CPU che Intel ha reso disponibili:
Processor number | Frequenza (Turbo Boost) | Core (Thread) | Cache | TDP | Memoria | Grafica |
---|---|---|---|---|---|---|
Intel Core i3-2310M | 2,1GHz (-) | 2 (4) | 3MB | 35W | DDR3 1066/1333 | Si |
Processor number | Frequenza (Turbo Boost) | Core (Thread) | Cache | TDP | Memoria | Grafica |
---|---|---|---|---|---|---|
Intel Core i5-2410M | 2,3GHz (2,9GHz) | 2 (4) | 3MB | 35W | DDR3 1066/1333 | Si |
Intel Core i5-2520M | 2,5GHz (3,2GHz) | 2 (4) | 3MB | 35W | DDR3 1066/1333 | Si |
Intel Core i5-2537M | 1,4GHz (2,3GHz) | 2 (4) | 3MB | 17W | DDR3 1066/1333 | Si |
Intel Core i5-2540M | 2,6GHz (3,3GHz) | 2 (4) | 3MB | 35W | DDR3 1066/1333 | Si |
Processor number | Frequenza (Turbo Boost) | Core (Thread) | Cache | TDP | Memoria | Grafica |
---|---|---|---|---|---|---|
Intel Core i7-2617M | 1,5GHz (2,6GHz) | 2 (4) | 4MB | 17W | DDR3 1066/1333 | Si |
Intel Core i7-2620M | 2,7GHz (3,4GHz) | 2 (4) | 4MB | 35W | DDR3 1066/1333 | Si |
Intel Core i7-2629M | 2,1GHz (3GHz) | 2 (4) | 4MB | 25W | DDR3 1066/1333 | Si |
Intel Core i7-2630QM | 2GHz (2,9GHz) | 4 (8) | 6MB | 45W | DDR3 1066/1333 | Si |
Intel Core i7-2635QM | 2GHz (2,9GHz) | 4 (8) | 6MB | 45W | DDR3 1066/1333 | Si |
Intel Core i7-2649M | 2,3GHz (3,2GHz) | 2 (4) | 4MB | 25W | DDR3 1066/1333 | Si |
Intel Core i7-2657M | 1,6GHz (2,7GHz) | 2 (4) | 4MB | 17W | DDR3 1066/1333 | Si |
Intel Core i7 2720QM | 2,2GHz (3,3GHz) | 4 (8) | 6MB | 45W | DDR3 1066/1333/1600 | Si |
Intel Core i7-2820QM | 2,3GHz (3,4GHz) | 4 (8) | 8MB | 45W | DDR3 1066/1333/1600 | Si |
Processor number | Frequenza (Turbo Boost) | Core (Thread) | Cache | TDP | Memoria | Grafica |
---|---|---|---|---|---|---|
Intel Core i7-2920XM | 2,5GHz (3,5GHz) | 4 (8) | 8MB | 55W | DDR3-1066/1333/1600 | Si |
Memoria LLC ex L3
Internamente l’architettura della CPU cambia geometria: mentre nella precedente versione Nehalem-Westmere avevamo un doppio die dove uno dei due era destinato alla grafica, ora nella nuova versione Sandy Bridge abbiamo un die monolitico con i due core e il processore grafico direttamente integrati in un unico package.
Ed è all’interno di questa unica unità che troviamo il primo cambiamento nella memoria nominata cache L3.
Nella generazione passata questa memoria serviva da supporto ai core presenti, ed era esterna ad essi, completi già di cache L1 ed L2 interna. Con la nuova generazione la L3 viene rinominata in LLC (Last Level Cache), in quanto diventa una memoria generale condivisibile anche dal core grafico integrato, oltre che ovviamente dai core di calcolo presenti. Mentre prima l’L3 era costituita da un unico blocco a sé stante, ora la LLC è ripartita in numero uguale a quello dei core presenti (anche se ciascun core può accedere alla totalità della cache di terzo livello), un quad core avrà quindi una LLC divisa in quattro parti così come in un dual core sarà divisa in due parti, tutto ciò per una migliore integrazione col nuovo collegamento interno adottato da Intel e nominato Ring-Bus che unisce tutte le unità funzionali della micro-architettura, e che andremo ad analizzare meglio in seguito.
Il componente che veniva denominata uncore in Nehalem-Westmere, ora cambia denominazione in System-Agent ed integra tutti i controlli necessari al funzionamento delle comunicazioni verso l’esterno della CPU (è quella parte del processore che eredita le funzioni in precedenza svolte dal Northbridge).
Core e AVX
Come nella precedente generazione, anche in Sandy Bridge la memoria che equipaggia il processore ammonta a 64 Kbyte per la L1, e a 256 kbyte per la L2.
I cambiamenti principali apportati dagli ingegneri Intel riguardano soprattutto aspetti molto profondi del funzionamento dei core. Le istruzioni in modalità out of order (procedura con la quale una CPU esegue le istruzioni secondo un ordine di disponibilità dei dati e non nell’ordine fornito originariamente dal programma interessato) vengono ora eseguite con un front end che può ricostruire l’ordine di esecuzione delle istruzioni per velocizzare lo sfruttamento delle risorse disponibili.
Si è inoltre deciso di non utilizzare più un file di registro centralizzato RRF (Retirement Register File) ma uno fisico, chiamato PRF (Phisycal Register File), così da poter trasportare solo i riferimenti (puntatori) degli operandi al PRF insieme alle istruzioni, e non più come in passato appesantire il trasporto delle istruzioni con una copia degli operandi.
E’ grazie a questo cambiamento che è stato possibile introdurre l’AVX (Advanced Vector Extension) che, agendo su operandi a 256 bit, con un RRF avrebbe richiesto un ingigantimento dei registri e dunque un aumento dei transistor che non avrebbe giovato nè ai costi nè ai consumi.
L’ Advanced Vector Extension può essere visto come un raffinamento delle istruzioni SSE e, come detto, lavora con operandi a 256 bit, grazie a una nuova gestione nell’Execution Cluster che ha tre porte di accesso (Esecution Port): una per i dati interi e due per i dati a virgola mobile. L’espediente utilizzato dagli ingegneri per utilizzare operandi a 256 bit su strade (Data Path) a 128 bit che conducono alle 3 porte di accesso sopra citate, è stato quello di fondere 2 Data Path a 128 bit in uno solo nel momento in cui un'istruzione AVX viene chiamata, cosi da supportare senza aumento di transistor anche gli operandi a 256 bit.
Grafica e QuickSync
Un altro passo avanti è stato fatto da Intel nell’integrazione dell’IGP (Integrated Graphics Processor): con Sandy Bridge si è deciso infatti di incorporare il core grafico direttamente nello stesso die del processore e non più solo nello stesso package, come era stato fatto invece nella precedente generazione. In quel modo infatti si era sì spostato il core grafico dal northbridge all’interno del package, ma esso era poi rimasto come un die a se stante, non portando miglioramenti prestazionali evidenti, come invece la nuova integrazione dimostra di fare.
Il core grafico nominato Graphics Media Accelerator riesce, anche grazie alla nuova tecnologia Quick-Sync e a una gestione dinamica nella distribuzione della potenza tra core e grafica, a dare una marcia in più alle sessioni di codifica e decodifica dei flussi video ora a livello hardware e non più software come avveniva nella precedente generazione.
Analizzando nel dettaglio le scelte di Intel si scopre che è stato deciso di accostare unità programmabili a unità di esecuzione con funzioni fisse, scelta che si allontana dalle concorrenti GPU che invece, per avere il massimo della libertà nel 3D, hanno adottato blocchi completamente programmabili lasciando in disuso unità a funzioni fisse.
Accostando i due tipi di unità (fisse e programmabili) si è però riusciti a mantenere discreto il numero di transistor in favore di consumi ed efficienza, tanto che il componente grafico di Intel è ora davvero competitivo con le soluzioni entry level dei produttori specifici di GPU.
TurboBoost 2.0
Il Turbo Boost, introdotto con la serie di CPU Nehalem, è la tecnologia che permette di aumentare dinamicamente la frequenza di uno o più core che sono impegnati nell’elaborazione, tenendo conto sia dei consumi che della temperatura.
In questa seconda versione (Intel Turbo Boost 2.0) è stato rivisto e migliorato da Intel sfruttando un fenomeno abbastanza intuitivo che avviene nei processori: ogni processore è progettato con un certo limite termico, normalmente però tale limite viene raggiunto dopo un certo tempo partendo dalla fase di idle (riposo). E' proprio durante questo intervallo temporale che il processore può superare il proprio limite di consumo e quindi aumentare le proprie capacità di calcolo prima di raggiungere il limite termico, ciò non comporta un superamento della frequenza massima impostata ma una permanenza su di essa maggiore nel tempo e capace di durare finché non si raggiunge tale limite termico.
Tutto il meccanismo dinamico è costantemente monitorato e analizzato dal System Agent e le tensioni, le frequenze e le temperature vengono controllate e gestite in tempo reale in modo che i limiti termici e di innalzamento operativo siano sempre bilanciati.
System Agent E Ring Bus
Il System Agent puo’ essere considerato come l’evoluzione del componente denominato uncore nella precedente generazione Nehalem-Westmere. E’ qui che troviamo le interfacce di comunicazione più importanti, e principalmente:
- il controller di memoria DDR3 a doppio canale che supporta DDR3 a 1333Mhz.
- il controller PCI Express x16.
- il Display-engine che trasferisce il segnale video, elaborato dalla grafica integrata, alle uscite video sulla motherboard.
- l’interfaccia DMI che collega CPU e chipset tra loro.
Con Nehalem e Westemere Intel aveva scelto un collegamento Crossbar, per unire tra loro le unità funzionali della micro-architettura, che pur avendo prestazioni elevate peccava nel consumo energetico e nella capacità di espansione col crescere dei core, rendendo necessaria ogni volta una riprogettazione e rivisitazione del sistema.
Con Sandy-Bridge si è invece deciso di adottare un collegamento nominato Ring-Bus (ad anello) dove le unità (core di calcolo, core grafico e System Agent) sono interconnesse tra loro con questa struttura circolare.
Ogni unità accede al bus circolare tramite delle porte che connettono i componenti sia superiormente che inferiormente così da poter rendere più breve possibile il percorso tra le unità, che sanno autonomamente e localmente se il bus è disponibile per essere utilizzato.
E’ inoltre ultimamente stato risolto il problema di progettazione che col passare del tempo avrebbe potuto limitare le capacità di gestione del flusso dati passante nel controller SATA dei chipset P67 e H67.
Conclusioni
Infine a dare ancor più colore al già ricco quadro di novità sono i miglioramenti introdotti nella tecnologia wireless: vengono infatti supportati in un solo componente il WiFi fino all’ultimo standard n con supporto ai Wireless Display (WiDi) per godere delle immagini in alta definizione anche su display esterni senza fili, WiMax (con selezione della banda 4G più veloce), PAN (Personal Area Network) e l’immancabile Bluetooth, tutti combinati in diverse configurazioni ognuna identificata dal nome Intel Centrino Advanced-N 6xxx o Intel Centrino Advanced-N + WiMax 6xxx.
Confrontando direttamente le CPU e le configurazioni di circa tre anni fa con quelle che vedremo nei prossimi mesi, si evidenzia un sostanziale sorpasso della nuova tecnologia tanto da far più che raddoppiare le prestazioni nella produttività e multimedialità, i numeri ottenuti dai test parlano davvero chiaro sulle possibilità offerte dalla nuova piattaforma.
C’è stato dunque un sostanziale miglioramento rispetto ai già collaudati processori Nehalem a 45nm e Westmere a 32 nm, che hanno fatto delle loro prestazioni la punta di diamante nel mondo consumer e prosumer.
Non c’è dubbio che la nuova piattaforma Sandy Bridge sappia ereditare il successo ottenuto dalla precedente generazione, grazie a prestazioni davvero insuperabili con consumi sempre controllati.