La tecnologia AMD Fusion a partire dalla sua genesi fino alla prima dimostrazione delle potenzialità dei processori Zacate ed Ontario basati su microarchitettura Bobcat.
Dopo un biennio di grande affanno, a seguito dell'acquisizione di ATI nel 2006, AMD è riuscita a riguadagnare competitività nel settore delle schede video ed ora volge la prua dritta verso il mercato dei processori per PC portatili, rinfocolando la mai sopita rivalità con Intel. E lo fa con una determinatezza che sembra preannunciare un duello appassionante come non succedeva più da diversi anni, portando la sfida direttamente all'IDF 2010: negli stessi giorni in cui Intel faceva accorrere giornalisti, sviluppatori ed operatori del settore a San Francisco per il suo forum, AMD organizzava una dimostrazione delle potenzialità dei processori Zacate, prima generazione di APU (Accelerated Processig Unit) Fusion.
Alla anteprima europea della stessa dimostrazione abbiamo assistito personalmente all'IFA ai primi di settembre, e possiamo confermare le impressioni positive riportate dai colleghi dei media internazionali. Ma prima di addentrarci nell'esame dell'architettura e delle performance dei futuri processori mobile di AMD, ripercorriamo le tappe che hanno condotto allo scenario attuale con l'aiuto di Sergio Ceresa, direttore vendite per l'Europa di AMD.
"Dopo l'acquisizione di ATI, AMD ha varato un piano di riorganizzazione aziendale, denominato Smart Assets Strategy, che prevede tutta una serie di trasformazioni radicali sia a livello di management sia di impostazione aziendale", ci ricorda Ceresa, che prosegue: "Forse la notizia che ha destato più scalpore è stata lo spin-off delle fabbriche, quindi venne creata una nuova azienda chiamata Global Foundries, in collaborazione con il fondo di investimento di Abu Dabi, cui ha fatto seguito nel corso dello scorso anno lo spin-off della fabbrica di Desdra, l'acquisizione di un'altra fonderia e la creazione di un nuovo impianto negli Stati Uniti per i processi produttivi a 32nm e future tecnologie."
Il nuovo corso di AMD passa anche per un ripensamento radicale delle strategie di comunicazione e marketing: nel settembre 2009 la Casa di Sunny Vale, cambiando un orientamento inveterato, ha sposato il concetto di piattaforma o ecosistema, un insieme di elementi costituto dalla CPU, dal chipset e dalla GPU. È nata così la piattaforma AMD Vision, inizialmente articolata in tre rami, Basic, Premium ed Ultimate, cui si accompagnerà da quest'anno anche la versione Black (già adottata da HP e Acer su alcuni notebook).
Pochi giorni fa, AMD ha annunciato un altro importante cambiamento nella propria strategia di branding, anche questa volta improntato alla semplificazione. A regime ci saranno solo 3 marchi: AMD corporate brand, Vision per tutte le piattaforme sia notebook che desktop (tutte le macchine che montano grafica integrata o con schede grafiche Nvidia avranno il solo brand AMD), e Radeon Graphics o FirePro Graphics per le schede video (il marchio ATI scompare a partire dall'introduzione della nuova generazione di GPU serie HD 6000).
"L'altra grande novità di quest'anno, è stato il lancio il 12 maggio di una coppia di nuove piattaforme, una per portatili mainstream, Danube, ed una destinata ai notebook thin&light, Nile. Entrambe sono state sposate in quantità da tutti i PC vendor, per un totale di 109 nuovi design di notebook e 26 nuovi design di ultrasottili e netbook. Abbiamo più che triplicato l'offerta di macchine AMD based, con due nuovi arrivi, Lenovo a gennaio, e Sony a maggio."
Fra i nuovi portatili AMD figura anche un'intera famiglia di netbook Acer, composta da ben 4 modelli, tutti caratterizzati dal completo supporto per la tecnologia HD e dalla presenza di una uscita HDMI: un mainstram da 10 pollici, Aspire One 521, ed uno da 11 pollici, AAO 721, una versione dedicata all'utenza professionale, Aspire One 1551, ed una indirizzata agli utenti più giovani ed attenti al design ed alle mode del momento, Packard Bell Dot A.
"La categoria netbook ha un trend di crescita molto interessante, attestandosi intorno al 24% a livello di mercato europeo. Interpretiamo la funzione di questi prodotti in linea con quella che è la value proposition di AMD: massima portabilità ed autonomia ma senza sacrificare quella che chiamiamo visual experience, in quanto anche per la semplice navigazione Web è richiesta una risposta video appagante. Con il gruppo Acer abbiamo realizzato questi HD netbook e con le prossime tecnologie Fusion, che saranno disponibili fra qualche mese, ci rivolgeremo in modo sempre più massiccio a tale categoria di prodotti."
Negli ultimi anni, AMD ha intensificato gli sforzi per mantenere la promessa di portare i primi computer Fusion sul mercato entro il 2011. Un po' come succede oggi per le piattaforme Danube e Nile, anche la futura ondata di portatili AMD Fusion potrà essere basata su due differenti piattaforme, denominate Sabine e Brazos, rispettivamente indirizzate ai notebook mainstream ed ai laptop ultrathin (macro-categoria nella quale il chipmaker californiano racchiude tanto i netbook quanto i notebook ultrasottili a basso voltaggio).
"Abbiamo accelerato il progetto Fusion, quindi il beneficio del know-how di ATI nell'ambito GPU al servizio di tutte quelle che sono le attività di computing e poi per l'anno prossimo in occasione del CES presenteremo le prime macchine basate sulla nuova tecnologia Fusion, che non significa avere la CPU e la GPU nello stesso die ma si tratta di avere la CPU e la GPU all'interno dello stesso silicio e quindi sfruttare al massimo le capacità di calcolo in parallelo della GPU", ci dice Sergio Ceresa.
La principale differenza fra le due piattaforme consisterà nei processori impiegati, i quad-core Llano a 32nm per Sabine, ed i dual-core Ontario (TDP di 9W) e Zacate (TDP di 18W), entrambi realizzati con miniaturizzazione a 40nm, per Brazos.
Contrariamente alle attese della vigilia, sembra che la prima piattaforma ad essere rilasciata possa essere Brazos e non Sabine: "i primi ecosistemi Brazos sono già in test presso gli OEM", così come sono basate su Brazos le demo esibite da AMD all'IFA, all'IDF ed al Computex.
Ad accomunare i processori Ontario e Zacate della piattaforma Brazos sarà l'architettura su cui saranno basati i loro core, nome in codice Bobcat, e di cui ci occupiamo in modo più approfondito in questo articolo. I processori Llano, invece, saranno basati sui più potenti core Bulldozer. Ricordiamo che stiamo parlando di processori AMD Fusion, quindi di SoC (System on a Chip, o APU, Accelerated Processing Units, mella terminologia di AMD), che integrano sullo stesso die anche una GPU, un controller di memoria e altri core specializzati (come ad esempio un motore di decodifica UVD).
Premettiamo inoltre che Bobcat è una microarchitettura X86-64 con supporto per la virtualizzazione e per le istruzioni SSE, SSE2, SSE3. Quindi manca ancora il supporto per le itruzioni SSE4.1 e SSE4.2 che arriverà solo in seguito con i processori Llano ed i core Bulldozer.
Bobcat sfrutta la metodologia d'esecuzione "fuori ordine" (out of order), in base alla quale il processore può stabilire un ordine di esecuzione delle istruzioni diverso da quello impostato dal programmatore. E' un approccio comune a tutti i processori odierni con l'eccezione delle CPU Atom, per le quali Intel ha preferito adottare la modalità d'esecuzione in ordine per guadagnare un vantaggio in termini di dimesioni del die e di consumi. Ne consegue che, già sulla carta, i processori Ontario saranno sensibilmente più veloci dei loro concorrenti Pineview a parità di clock, pur mantenendo un TDP competitivo pari a soli 8W (i comuni processori Atom single-core hanno un TDP di 6,5W, mentre gli Atom N550 dual-core hanno un TDP di 8,5W).
Analizzando lo schema a blocchi di Bobcat notiamo che ciascun core ha 64KB di cache L1 parzialmente associativa (32KB per le istruzioni ed altri 32KB per i dati) e 512KB di cache di secondo livello. La Branch Prediction Unit è ancora avvolta da un alone di segretezza: AMD indica quest'area come possibile destinataria di importanti innovazioni ma non ha ancora scoperto completamente le sue carte.
Le cinque fasi originarie dell'elaborazione, Fetch (acquisizione delle istruzioni dalla memoria), Decodifica, Esecuzione, Memoria e Writeback (scrittura del risultato nel registro) vengono spezzettate in 15 stadi, permettendo di avere un livello di throughput competitivo con quello dei processori Atom (che hanno una pipeline a 16 stadi).
L'unità di decodifica a doppio binario traduce le istruzioni x86 in micro-operazioni (o micro-ops) e le trasmette agli scheduler che scandiscono il lavoro delle unità ALU, AGU ed FPU (per i calcoli in virgola mobile). In base ad informazioni divulgate da AMD, "il decoder è in grado di raggruppare l'89% delle istruzioni x86 in un'unica micro-operazione, un altro 10% in sole due micro-operazioni, ed il restante 1%, composto da istruzioni più complesse, viene tradotto in microcodice." Si tratta di un approccio efficiente, del tutto comparabile a quello implementato da Intel nei suoi processori.
Abbiamo già accennato al TDP massimo dei processori Ontario e Zacate, ma è interessante scoprire che di quei 9W e 18W, meno di 1W è consumato da ciascun core Bobcat. Questo risultato è stato ottenuto tramite un attento bilanciamento di vantaggi e costi in termini di prestazioni e consumi, privilegiando quelle soluzioni architetturali che si sono rivelate più efficienti, come i registri fisici di file, un ridotto uso delle code di scorrimento, ed una tecnica di clock gating più granulare.
Ontario e Zacate sono le prime due incarnazioni delle APU AMD Fusion. Ciò implica che il die del processore racchiude, oltre alla CPU, anche una GPU, la prima in veste di processore scalare, la seconda in veste di processore vettoriale. L'innovazione di questi chip consiste proprio in questo: i core della scheda grafica interverranno in maniera incisiva per fare da volano a quelle applicazioni che possono trarre maggiore vantaggio dal calcolo parallelo.
La GPU ha potenzialità che vanno ben oltre le applicazioni grafiche, che finalmente potranno essere sfruttate pienamente per favorire la nascita di una nuova generazione di software. Molte di queste applicazioni sono già disponibili in nuce ma richiedono capacità di calcolo che gli attuali PC mainstream non riescono ad esprimere. Ci riferiamo ad esempio alle enormi potenzialità delle nuove interfacce naturali (tocco, comandi vocali, gestures e persino espressioni del volto), oppure alla conversione in tempo reale di video e foto 2D in tre dimensioni, o ancora alle videochiamate in alta definizione. In sostanza c'è una sterminata distesa di nuove opportunità che AMD Fusion promette di mettere a disposizione di tutti a prezzi competitivi.
Per accedere a questi benefici, sarà però necessario disporre di programmi che sfruttino la capacità di calcolo combinata di CPU e GPU. A tale scopo AMD sta collaborando attivamente con altre realtà IT di prim'ordine per velocizzare e facilitare questa transizione.
Oltre a ATI Stream SDK, il kit di sviluppo che permette già da alcuni anni di impiegare le GPU ATI a fini di calcolo, AMD Fusion supporta OpenCL, un ambiente di sviluppo aperto e standardizzato che permette di scrivere codice che può essere eseguito su una grande varietà di piattaforme hardware, e tra le altre features consente di bilanciare il carico di lavoro fra CPU e GPU, ottenendo risultati eccellenti con le nuove APU AMD.
Anche Microsoft con le API DirectX si sta interessando ai nuovi scenari resi possibili dall'utilizzo dell'acceleratore grafico per il calcolo parallelo. In particolare le API D2D, supportate dai browser Internet Explorer 9 e Mozilla Firefox 4, promettono prestazioni finora inimmaginabili nel gaming online e nelle applicazioni messe a disposizione da The Cloud, mentre le API DirectCompute permettono ai coder di sfruttare le risorse della GPU in modo più flessibile ed immediato, come ha fatto Cyberlink con FaceMe, una tecnologia che serve ad individuare rapidamente i volti all'interno delle fotografie.
Migliora, infine, anche l'interazione con il set di API OpenGL che a partire dalla versione 4.0 introduce un supporto migliorato per il GPGPU (General-Purpose computing on Graphics Processing Units) con OpenCL.
AMD sostiene che, per merito dell'integrazione fisica e funzionale fra CPU e GPU, un processore Ontario sarà in grado di garantire fino al 90% delle prestazioni degli odierni processori di fascia media, in un die che occupa la metà dell'area. Si tratta di un dato che per ora non abbiamo potuto verificare direttamente, ma se confermato avrebbe una portata epocale: netbook e tablet PC non sarebbero più meri strumenti di fruizione di contenuti e di accesso al Web ma permetterebbero finalmente di giocare 3D, di lavorare, di avere un'esperienza d'uso paragonabile a quella offerta da un attuale notebook di fascia media.
Per ora, AMD ci ha permesso di vedere all'opera da vicino solo il processore Zacate (18W) montato su una piattaforma di testing e messo a confronto con un un notebook equipaggiato con Core i5-520M (35W), ma già questi primi benchmark sembrano fornire risposte rassicuranti.
Lo scopo della dimostrazione era quello di evidenziare le capacità delle APU AMD Fusion con doppio core Bobcat nello streaming di video ad alta definizione online, nei giochi 3D DirectX 11, e nell'accelerazione hardware della navigazione Web. Nei test di gioco, condotti su titoli quali City of Heroes e Batman Arkham Asylum, Zacate ha fatto registrare un framerate superiore del 50% o più, così come nel Psychadelic benchmark di HTML5 e nel test di Amazon Shelf.
Il solco rispetto ai processori Arrandale di Intel diventa molto più ampio quando si passa a benchmark che riescono a sfruttare al meglio l'esecuzione GPGPU tramite DirectCompute. Nonostante i risultati di queste prove comparative vadano presi cum grano salis, perché raffrontano chip di due generazioni differenti, tuttavia non si può negare che l'esordio di AMD Fusion sia stato un successo, salutato con entusiasmo da tutti gli appassionati di mobile computing.