AMD ha ufficializzato i modelli delle nuove APU Beema e Mullins, destinate rispettivamente ai notebook entry level e ai tablet, che promettono prestazioni nettamente superiori non solo ai predecessori ma anche a quelle degli Intel Atom. Vediamone dunque assieme le principali caratteristiche tecniche e i modelli che saranno presto disponibili.
AMD aveva presentato ufficialmente a novembre 2013 le nuove famiglie di APU Beema e Mullins, eredi rispettivamente di Kabini e Temash e destinate a portatili economici e tablet. Il chipmaker californiano aveva parlato all'epoca di performance raddoppiate con consumi ridotti rispetto alla generazione precedente, pur non specificando cosa cambiava in sostanza tra Puma+, l'architettura attuale, e Jaguar, entrambe tra l'altro sempre prodotte a 28 nm.
In questi giorni però le nuove APU sono finalmente in dirittura d'arrivo e quindi l'azienda di Sunnyvale ha divulgato nomi specifici e caratteristiche tecniche dei primi modelli di entrambe le lineup, che a breve inizieranno ad equipaggiare notebook e tablet. Lo scorso anno Kabini e Temash si rivelarono poco competitivi perché praticamente quasi tutte le APU avevano un TDP di circa 15 W, con solo un paio di modelli che scendevano attorno agli 8/9 W e un single core da appena 1 GHz con TDP di 3.9 W. In confronto ad esempio Intel proponeva i ben più potenti Haswell con un TDP simile oppure gli Intel Atom Bay Trail dotati di frequenze operative più elevate e TDP al di sotto degli 8 W. Con Beema e Mullins quindi AMD ha voluto rispondere proponendo un prodotto più competitivo su tutti i fronti.
NOVITA' ARCHITETTURALI E TRUSTZONE
Andando nel dettaglio scopriamo dunque che Puma+ combina ancora una volta quattro core x86 come faceva Jaguar (ci sono un paio di modelli dual core ma sono ricavati sostanzialmente da quelli di fascia superiore) ed è realizzato sempre come detto con lo stesso processo produttivo precedente. Allo stesso modo anche le GPU sono delle Radeon basate su architettura GCN con 128 core. Anche la microarchitettura infine è rimasta identica (2-wide Out Of Order), così come il numero di unità di esecuzione e strutture dati.
Nonostante queste similitudini però AMD parla di una riduzione dell'effetto leakage pari al 19 % per il core e addirittura al 38 % per la GPU, con un riflesso positivo sui consumi complessivi, scesi di circa il 20 % e di un significativo aumento delle prestazioni globali, mentre il numero totale di transitor è aumentato, passando dai precedenti 914 milioni a 930 milioni, pur mantenendo inalterata l'area del die, che ammonta sempre a circa 107 mm2. E' cambiata l'interfaccia memoria, che può ora contare su una nuova modalità a basso consumo per le DDR3-1333, che ha portato a una riduzione negli assorbimenti di 500 m, e all'introduzione del supporto alle più veloci DDR3-1866 e l'interfaccia display, ora dotata di una nuova logica di gestione dei voltaggi che permette di abbattere anche in questo caso i consumi, con una riduzione di circa 200 mW.
Ma la novità più grande, che può contribuire probabilmente a giustificare l'aumento del numero di transistor, è l'integrazione in Beema e Mullins della nuova piattaforma hardware di sicurezza ARM-based chiamata PSP o Platform Security Processor, una soluzione basata sulla struttura standard ARM TrustZone che comprende essenzialmente un co-processore dedicato alla cifratura dati e diversi engine di tipo RSA, SHA, ECC ed AES. Il core offre anche funzioni di secure boot e, avendo ROM e RAM dedicate e isolate dal resto del sistema, può sostituire in caso di emergenza alcune risorse fondamentali per far fronte alle minacce.
Per essere supportato nelle proprie funzionalità PSP necessita di software apposito ma è anche vero che, essendo basato su ARM TrustZone, il supporto non dovrebbe tardare ad arrivare. PSP dunque consente alle APU delle famiglie Beema e Mullins di supportare pienamente un ambiente di tipo TEE (Trusted Execution Environment) accanto a servizi di sicurezza e applicazioni di tipo TA (Trusted Applications). Se però, al di là di queste differenze, Beema e Mullins sono delle APU sostanzialmente identiche a Kabini e Temash, com'è stato possibile ottenere un maggior risparmio energetico e prestazioni superiori? AMD non è scesa nei dettagli tecnici ma ha fatto riferimento a un mix di migliorie architetturali e a una maggior messa a punto del sistema litografico, che avrebbero consentito di aumentare sensibilmente i clock rate di base e soprattutto i picchi raggiungibili in turbo mode, diminuendo nel contempo l'assorbimento energetico.
NUOVO TURBO BOOST E GESTIONE ENERGETICA
Tra le soluzioni che hanno consentito di conseguire questi risultati troviamo una nuova tipologia di turbo e di gestione del risparmio energetico, denominata STAPM (Skin Temperature Aware Power Management). In entrambi i casi più che nuove tecnologie si tratta però di "trucchi" o, per meglio dire, workaround rispetto al problema principale, vediamo di spiegarci meglio. Seguendo le orme di Intel, anzitutto anche AMD ha deciso di non indicare più le frequenza operativa base delle proprie APU, riportando solo il clock rate massimo raggiungibile in turbo mode.
Quest'ultimo comunque è sostanzialmente più elevato sia per quanto riguarda Beema che Mullins rispetto alla generazione 2013 di APU: come mai, visto che il sistema litografico e l'architettura come visto sono identiche? Semplice, perché grazie all'ottimizzazione dei consumi e al conseguente abbassamento del TDP, ora le nuove APU hanno una soglia più alta da raggiungere e possono quindi mantenere una frequenza più elevata per brevi periodi di tempo, a loro volta comunque superiori rispetto al passato, prima di dover tornare a lavorare al clock standard, consentendo così di ottenere prestazioni migliori a parità di architettura.
A seconda dei modelli di APU presi in considerazione si ha infatti un aumento della frequenza della CPU compreso tra il 7 e il 35 % da Kabini a Beema e tra il 40 e il 60 % da Temash a Mullins, mentre per la GPU nel primo caso si va dall'11 al 33 % e nel secondo dal 16 al 33 %. L'aumento del valore termico massimo raggiungibile a sua volta è stato ottenuto semplicemente cambiando i valori di riferimento. A Sunnyvale infatti si sono resi conto che, in un tablet o in un notebook, il processore raggiungerà la temperatura limite dello chassis, oltre la quale cioè non è più confortevole manipolare il device, molto prima del proprio limite fisico. Con Beema e Mullins dunque la soglia massima dopo la quale la frequenza operativa viene diminuita è stata portata da 60 a 100° C pur restando ancora ampiamente entro limiti fisici accettabili, ma soprattutto ha stabilito che è la temperatura raggiunta sulla superficie del die e non al suo interno ad essere cruciale. Ancora una volta dunque quello che si ottiene così facendo è la possibilità di operare per un tempo più lungo a frequenze più elevate prima di dover limitare il clock rate della APU.