Le APU di ultima generazione “Carrizo” sviluppate da AMD per il segmento mobile mainstream si presentano come una serie di prodotti che consolidano i punti di forza delle soluzioni del chipmaker californiano estendendo i vantaggi ottenibili da un più esteso sfruttamento della GPU integrata e dell’accelerazione hardware per la transcodifica di flussi video. Questo aspetto, unito a un nuovo design a livello di architettura e a una serie di ottimizzazioni, contribuisce a quello che si presenta come un salto generazionale in termini di efficienza energetica per AMD, al punto da promettere un’autonomia pressoché raddoppiata in moltissimi scenari d’uso.

Considerando che Carrizo non può avvantaggiarsi di nessun potenziale benefit a costo zero che sarebbe stato possibile ottenere riducendo il processo produttivo (rimasto a 28nm), la “ricetta” che ha reso possibile questi risultati è particolarmente interessante e articolata.

AMD Carrizo

AMD Carrizo

Pur mantenendo le dimensioni del chip pressoché invariate rispetto alla precedente generazione “Kaveri”, i nuovi chip Carrizo sono caratterizzati da un incremento del 29% nel numero di transistor per un totale di 3.1 miliardi. Questo risultato notevole è stato ottenuto grazie all’adozione di un approccio ad alta densità per quanto riguarda le librerie delle CPU “Excavator”, ottenendo una riduzione della superficie pari al 23% (con conseguente abbassamento dei consumi) senza variare il processo produttivo.

La precedente architettura “Steamroller” era infatti caratterizzata da una collezione di blocchi di circuiti integrati disegnati e sviluppati appositamente per realizzare le funzioni di esercizio della CPU che AMD definisce “High Performance Library”. Le alte prestazioni pagavano tuttavia il costo di unità funzionali progettate individualmente e non ottimizzate per i consumi. Nel lungo processo di sviluppo di Excavator (3 anni), è stato quindi apportato un processo di ristrutturazione e sintesi delle librerie di Steamroller per mantenere intatte le funzionalità razionalizzando e comprimendo la circuiteria.

AMD Carrizo

AMD Carrizo

I cambiamenti che hanno portato all’attuale CPU Excavator però non finiscono qui. Un’altra sostanziale differenza rispetto a Steamroller è nelle cache di primo e secondo livello. Confrontando le caratteristiche delle due CPU salta subito all’occhio come la cache L2 sia stata dimezzata, passando da 4MB a 2MB. Benché questo cambiamento possa apparire come un passo indietro, occorre considerare che una riduzione di questa portata ha contribuito a diminuire sostanzialmente le dimensioni complessive del package.

Questo da solo non porterebbe tuttavia un vero vantaggio nei consumi: una cache più piccola significa incorrere in più cache miss, quindi potenzialmente molti più accessi a memoria con conseguente peggioramento di prestazioni e aumento dei consumi. Per ovviare a questo problema AMD ha raddoppiato la cache L1 integrando una serie di miglioramenti nel prefetching al fine di mantenere le latenze invariate. Questo, congiuntamente a un perfezionamento del clock gating e ad ulteriori accorgimenti, porterebbe complessivamente a un dimezzamento teorico dei consumi connessi alla gestione della cache.

A tutto questo si aggiungono dei miglioramenti nella predizione di diramazioni (branch prediction) e il supporto alle nuove modalità di standby a basso consumo che garantiscono un incremento complessivo di 4-15% istruzioni per clock nonostante le riduzioni di superficie e assorbimento.

AMD Carrizo

AMD CarrizoAMD Carrizo

Considerando come l’esperienza utente nella fruizione di contenuti multimediali rappresenti uno degli obiettivi centrali di Carrizo, non c’è da sorprendersi se anche questa area sia stata oggetto di ottimizzazioni a livello di efficienza.

La modifica di maggior impatto consiste probabilmente nell’integrazione di funzionalità di rescaling e image processing direttamente nella display control engine. Questo “semplice” accorgimento permette di accorciare sostanzialmente il percorso che il flusso dati deve effettuare evitando il passaggio per la GPU e quindi risparmiando due accessi a memoria (lettura del flusso preprocessato, scrittura del flusso elaborato).

Poiché lo Unified Video Decoder (UVD) 6 è stato progettato con una banda di decodifica 4 volte superiore rispetto al predecessore per supportare flussi 4K, un ulteriore opportunità di ottimizzazione è stata sfruttata minimizzando il peso dei “tempi morti” nella decodifica di flussi HD grazie al power gating dinamico della DRAM: completando un frame 1080p in 1/4 della durata di un frame (considerando una frequenza di 30 fps), Carrizo è in grado di portare la DRAM nello stato di assorbimento minimo fino al momento in cui sarà richiesto il rendering del successivo frame.

Queste migliorie hardware e firmware unite all’integrazione dell’FCH sul die risulterebbero in un risparmio energetico complessivo di oltre il 50% nella riproduzione di video HD.

  • Indietro
  • Avanti
Google News
Le notizie e le recensioni di Notebook Italia sono anche su Google News. Seguici cliccando sulla stellina

Commenti