La CPU "Krait"

La CPU utilizzata dall'MSM8960 è basata su instruction-set ARM e interamente realizzata da Qualcomm. Si tratta in altri termini di un processore ARM A9 fortemente personalizzato che dovrebbe garantire prestazioni superiori rispetto all'architettura di riferimento e ai principali competitor mantenendo tuttavia i consumi contenuti.
Di seguito riportiamo una tabella dettagliata delle differenze tecniche tra il nuovo Krait, la precedente generazione Scorpion e l'architettura di riferimento ARM Cortex A9.

Arm Cortex A9Qualcomm ScorpionQualcomm Krait
Ampiezza decodifica 2 2 3
Ampiezza emissione nd 3 4
Porte di esecuzione nd 3 7
Stadi pipeline 8 10 11
Esecuzione out-of-order Parziale
FPU VFPv3 opzionale VFPv3 VFPv3
NEON Opzionale (64bit) Sì (128bit) Sì (128bit)
Processo produttivo 40nm 40nm 28nm

Benché un superficiale confronto numerico mostri come la nuova architettura sviluppata da Qualcomm rappresenti un miglioramento rispetto alla precedente generazione e al Cortex A9, vediamo di approfondire il significato di questi numeri per capire fino in fondo cosa offre di nuovo Krait.

Prestazioni del processore Qualcomm Snapdragon S4 a confronto con una CPU quad-core

Cominciamo con il sottolineare che il nuovo processore impiegato dallo MSM8960 supporta pienamente l'esecuzione fuori ordine di istruzioni. Questo è un requisito cui qualunque sistema ad alte prestazioni non può rinunciare, e permette alla CPU di processare più istruzioni senza dover di volta in volta attendere esecuzione ed emissione di istruzioni precedenti cronologicamente ma non causalmente.

Il back-end di processamento delle istruzioni ha coerentemente ricevuto un potenziamento, permettendo al Krait di decodificare (e quindi preparare per l'esecuzione) fino a 3 istruzioni per clock e di emetterne (cioè concluderne l'esecuzione) fino a 4 per clock. Le porte di esecuzione per il processamento vero e proprio delle operazioni sono state quindi sovradimensionate in numero (ne abbiamo 7) per evitare possibili limitazioni strutturali al parallelismo. Sempre per perseguire quest'ultimo e migliorare efficienza e prestazioni, la pipeline per operazioni integer è stata estesa a 11 stadi: questa permette al processore di diminuire la latenza suddividendo l'esecuzione di un'operazione intera in 11 fasi mettendo in coda più operazioni in stadi di elaborazione differenti e realizzando quindi l'equivalente di una catena di montaggio.

Per tracciare un parallelo con architetture di tutt'altro segmento, l'Intel P6 sul quale si basavano i Pentium M Banias, Dothan e Yonah, sulla carta ha molte somiglianze con Krait, tra cui la dimensione della pipeline e il back-end 4-wide con consegna fuori ordine. Se confrontato con i più recenti Intel Atom Silverthorne, dotati di una microarchitettura con emissione 2-wide di istruzioni e pipeline a 16 stadi in-order, i vantaggi di Krait divengono davvero sostanziali. Non dimentichiamo tuttavia che in entrambi i casi abbiamo fatto riferimento a piattaforme con TDP sensibilmente più elevati (specie nel caso del Pentium M) destinate a dispositivi dotati di batterie ben più capienti e form factor molto meno compatti.

Tornando a Krait e al confronto con ARM Cortex A9 standard, Qualcomm ha dotato la sua CPU di due importantissimi moduli previsti opzionalmente nel Cortex A9: il coprocessore floating point VFPv3 e la media processing engine NEON.
Il coprocessore Vector Floating Point (VFP) v3-D16 di cui l'MSM8960 è dotato rappresenta una soluzione a basso costo per l'accelerazione di operazioni in virgola mobile (single/double-precision). Anche questo opera in modo out-of-order, e in combinazione con NEON garantisce un'accelerazione hardware di applicazioni grafiche che prevedano trasformazioni 2D e 3D, generazione/rendering di font e applicazione di filtri digitali.

NEON è un motore SIMD (Single Instruction Multiple Data) general-purpose in grado di accelerare applicazioni di elaborazione batch multimediale e di segnali. Rispetto all'unità NEON opzionale dell'A9, Krait è dotato di una versione con ampiezza doppia (in modo simile al modulo NEON del Cortex A15) che permette il processamento di vettori da 128 bit in un solo passaggio.
Rispetto a soluzioni alternative sprovviste di FPU e tecnologie SIMD, Krait ha dunque un notevole vantaggio in scenari d'uso disparati sia dal punto di vista prestazionale che per quanto riguarda il livello di efficienza.

Questo aspetto, combinato con il passaggio al processo produttivo da 28 nm, contribuisce a mantenere i consumi di Krait contenuti nonostante l'incremento prestazionale. Come vedremo più avanti nelle demo presentate all'MWC, Qualcomm ha affrontato il tema dei consumi anche su altri fronti.

  • Indietro
  • Avanti
Google News
Le notizie e le recensioni di Notebook Italia sono anche su Google News. Seguici cliccando sulla stellina

Commenti