Procesoare grafice: detalii tehnice

Pipelines / Shaders (Vertex / Geometry / Pixel) sau CUDA cores

In esenta aceastea sunt un fel de mini-procesoare specializate in calcule matematice/geometrice care duc greul in procesarea informatiei grafice. Ele transforma instructiunile grafice 3D in imaginea care ulterior se afiseaza pe ecran. Cu cat un procesor grafic are mai multe shadere cu atat poate sa proceseze mai multa informatie si este deci mai puternic. Astfel, shaderele sunt un element definitoriu al performantelor pe care le ofera un procesor grafic/placa video.

Shaderele sunt intotdeauna grupate in “clustere”, care sunt practic unitatea de baza a arhitecturii unui procesor grafic. Exemplu: Arhitectura Nvidia pentru seria 400M si 500M foloseste clustere de cate 32 de shadere. Dar pot exista placi video care folosesc doar jumatate de cluster.

AMD (ATI) vs Nvidia

Pentru a evita confuziile in compararea placilor video AMD cu cele Nvidia, trebuie sa facem o mentionare foarte importanta. Nvidia foloseste intotdeauna shadere “puternice” sau complete. Acestea sunt shadere care pot sa faca toate tipurile de calcule specifice acestora. AMD in schimb foloseste shadere mai simple, mai mici si care sunt specializate pe un anumit tip de calcul geometric. De aceea, procesoarele grafice AMD au in fisa lor trecute mult mai multe shadere in comparatie cu procesoarele grafice Nvidia.

Astfel, pana la seria 6000 de la AMD (inclusiv), se poate spune in linii mari ca 5 shadere AMD sunt echivalentul a unui shader Nvidia. Exemplu: o placa video ATI Mobility Radeon 5650 cu 400 de shadere ar fi de fapt echivalentul unei placi video Nvidia cu 80 de shadere.

Se pare ca de la seria 7000 incolo, AMD isi va schimba putin arhitectura si astfel 4 shadere AMD vor fi echivalente cu un shader Nvidia.

Nvidia foloseste deseori in loc de denumirea clasica de “shader” denumirea de CUDA core. In esenta sunt acelasi lucru, doar ca tehnologia CUDA permite folosirea shadere-lor si la alte activitati diferite de cele de procesare grafica. Exemple de astfel de activitati ar fi acelerarea interactiunilor fizice, a calculelor pur matematice folosite in cercetare sau decriptarea de parole.

In cazul placilor video Intel, shaderele poarta  denumirea de “Execution Units” sau “EU” cores.

Arhitectura Fermi
In imagine este interiorul unui procesor grafic care foloseste arhitectura Fermi de la Nvidia (GTX 480 / GTX 480M / GTX 580 )

Texture mapping unit (TMU)

Acestea sunt tot niste unitati de calcul specializate care lucreaza impreuna cu shaderele si a caror treaba este sa calculeze ce culoare trebuie sa aiba fiecare pixel in functie de textura aplicata de programul/jocul 3D.

ROP – Render Output Unit – Raster Operations Pipeline

Aceste elemente din arhitectura unei placi video au rolul de a scrie si de a citi informatia de pe memoria video. Tot ele sunt responsabile pentru forma finala pe care o ia imaginea pe ecran, fiind ultimul stadiul pe care il efectueaza placa video in procesarea informatiei. Daca placa video dispune de multa memorie video, atunci va avea nevoie de multe unitati de acest gen pentru a putea folosi memoria video disponibila in mod eficient.

Scheme arhitecturii
Schema arhitecturii AMD folosita in placile video pentru laptopuri 6970M si 6950M (stanga) si schema arhitecturii Nvidia folosita in placile video GTX 480M / GTX 485M (dreapta)

Bus type

Acesta defineste tipul de memorie video pe care il poate folosi procesorul grafic. Poate sa fie GDDR2 (DDR2), GDDR3 (DDR3) sau GDDR5.

Bus width

Aceasta caracteristica reprezinta cantitatea de memorie pe care o poate accesa placa video pe ciclu de procesare. Cu cate este mai mare, cu atat placa video poate accesa mai multa memorie in acelasi timp. Astfel, un Bus mare de 256-bit sau 512-bit va pune foarte bine in valoare o cantitate mare de memorie video. De aceea, placile care au astfel de Bus-uri se bucura de 1 – 1.5 GB de memorie video. Majoritatea placilor video pentru laptopuri au Bus-uri de 128-bit si in general 512MB -768 MB sunt mai mult decat suficienti.

O alta consecinta a acestei specificatii tehnice este cantitatea de memorie care o intalnim la o placa video. Intotdeauna cantitatea de memorie este un multiplu al Bus-ului de memorie. Astfel o placa video cu un Bus de 384-bit nu va avea niciodata 1 GB de memorie video, fie va avea 768 MB fie 1536 MB.

DirectX / Shader Model

O explicatie simplista ar fi ca DirectX reprezinta un set de instructiuni care mediaza interactiunea dintre programe (in cazul de fata jocurile 3D) si componentele hardware care executa aceste programe. Fiecare versiune noua de DirectX are niste seturi noi de instructiuni, seturi care de multe ori necesita un nou gen de hardware care sa stie sa le interpreteze. Arhitectura hardware care suporta noile instructiuni poarta denumirea de “Shader Model”. Astfel placile video cu Shader Model 3.0 stiu sa foloseasca instructiunile implementate pana la DirectX 9.0, cele cu Shader Model 4.0 cele pana la DirectX 10.0, cele cu Shader Model 5.0 pana la DirectX 11 si asa mai departe.

Ar mai fi de mentionat ca fiecare joc este facut pe baza anumitor instructiuni DirectX si deci nu va putea rula decat daca placa video are implementata in arhitectura ei “Shader Model”-ul minim necesar acelei versiuni de DirectX.

Procesoarele pentru laptop: Aparitii viitoare (2011-2012)

Pentru cei inca nehotarati daca sa cumpere un laptop acum sau sa astepte modelele urmatoare, acest articol ofera cateva informatii despre generatiile urmatoare de procesoare. Atragem insa atentia ca discutam despre produse care nu sunt inca lansate oficial. Prin urmare, specificatiile finale ale procesoarelor discutate aici pot sa difere fata de informatiile preliminare.

*** Atentie! Acest articol va fi actualizat in mod constant in functie de informatiile care mai apar. ***


Procesoarele Intel in 2011-2012

A doua generatie Core “i” – 2011

A doua generatie de procesoare pentru laptop Core “i”, lansata la CES in ianuarie 2011, va primi cel mai probabil un resfresh in vara lui 2011 (iunie-iulie). Acest lucru inseamna ca Intel va lansa niste procesoare noi care la acelasi pret cu modelele actuale vor avea viteza cam cu 100 MHz mai mare (gen de la 2.40 GHz  sare la 2.50 GHz). Restul de specificatii vor ramane neschimbate. Evident nu este vorba de un salt spectaculos de performanta, dar pentru cei care vor sa astepte este un bonus binevenit.


Platforma Chief River (Ivy Bridge) – 2011 / 2012
– a treia generatie Core “i” –

Platforma Intel din 2012 nu va aduce schimbari majore in materie de arhitectura sau functii, din acest punct de vedere fiind doar o varianta imbunatatita a platformei actuale. Dar acest lucru nu inseamna ca nu va oferi un salt substantial de performanta. De fapt, procesoarele Ivy Bridge urmeaza sa fie facute utilizand integral procesul de fabricatie de 22nm, ceea ce inseamna ca acestea o sa aiba performante mai mari cu aproximativ 20-30% fata de procesoarele actuale si posibil si preturi mai mici.

Printre beneficiile procesoarelor din a treia generatie Core “i” se numara:
suport nativ pentru USB 3.0 (4 porturi)
suport pentru PCIe 3.0
– procesoarele quad-core (cu 4 nuclee de calcul) vor intra si in gama mainstream
– poate folosi memorii DDR3 de pana la 1600 MHz
procesorul grafic integrat o sa aiba 16 EU (shadere) fata de 12 cate are acum – realizand un salt de performanta de  cel putin 30%
– procesorul grafic o sa fie compatibil DirectX 11
– se speculeaza ca unele laptopuri din generatia actuala vor putea fi upgradate cu procesoare din noua generatie Ivy Bridge

Platforma Ivy Bridge se va lansa cel mai probabil la CES (Consumer Electronics Show), in ianuarie 2012.


Arhitectura Haswell – 2013
Deocamdata nu se stiu foarte multe despre procesoarele care vor apare pe aceasta arhitectura. Dar multe din elementele arhitecturii actuale for fi reproiectate sau imbunatatite. Ele vor fi produse folosind procesul de 22nm si vor apare cel mai probabil in ianuarie-februarie 2013.


Pentru netbookuri

Urmatoarea generatie de procesoare Atom, numita Cedarview, va apare cel mai devreme in toamna lui 2011. Ea reprezinta o arhitectura unificata, in care procesorul principal, procesorul grafic si controlerul de memorie se gasesc toate pe acelasi chip. Printre beneficiile aduse de noua platforma se numara dublarea performantelor grafice si utilizarea de memorii DDR3 la 1066 MHz. De asemenea, noile procesoare vor fi facute folosind procesul de fabricatie de 32nm, fata de 45nm cum este pentru procesoarele Atom actuale.


Procesoarele AMD in 2011-2012

Platforma Sabine (Llano) – 2011

Un procesor AMD Llano (deasupra) / arhitectura interna a acestui procesor (sub)
Un procesor AMD Llano (deasupra) / arhitectura interna a acestui procesor (sub)

In a doua jumatate a lui 2011 (cel mai probabil iunie-iulie) AMD o sa introduca pe piata primele procesoare “Fusion” pentru laptopurile din clasa medie si de varf. Fusion reprezinta o arhitectura unificata procesor-placa video la care AMD lucreaza de aproape 5 ani. Prin aceasta arhitectura placa video si procesorul grafic sunt unite intr-un singur chip, impartasind o parte din functii si eventual ajuntandu-se reciproc pentru a spori performantele laptopului in functie de necesitate. Acest chip unificat poarta denumirea de “accelerated processing unit” sau APU.

Mai important, AMD va migra la procesul de fabricatie de 32nm, ceea ce va duce la o reducere majora a decalajului actual de performanta dintre procesoarele AMD si Intel  (desi nu se preconizeaza ca AMD va ajunge pe Intel din urma). Totodata, AMD va introduce in procesoarele sale o functie numita “Turbo Core” care este foarte asemanatoare in functionalitate cu functia “Turbo” de la Intel.

Marele  avantaj pe care il vor aduce procesoarele Llano este performanta superioara oferita de placa video integrata precum si pretul competitiv. Informatiile preliminare indica o performanta a placi video integrate sensibil mai buna decat a placilor video integrate Intel actuale si viitore (2011). Se speculeaza ca chipsetul video din procesoarele Llano este o varianta derivata din actualul procesor grafic ATI Mobility 5650.

Alte specificatii ale platformei Llano:

– Procesoare cu 2 pana la 4 nuclee de calcul si cu un consum de curent de 25W pana la 45W
– Suport pentru memorii DDR3 – 1066 MHz si 1600 MHz
– USB 3.0
– SATA 3.0
– PCIe 2.0


Arhitectura Trinity – 2012

La inceptul lui 2012 AMD va lansa a doua generatie de procesoare “Fusion”, bazata pe arhitectura Bulldozer. Acestea ar trebui sa ofere o performanta foarte bune la un pret accesbil, mai ales ca arhitectura Bulldozer este capabila sa intre in competitie directa cu procesoarele Core i7 de la Intel. Din nefericire insa, aceste procesoare vor fi facute folosind procesul de fabricatie de 32nm, in timp ce Intel va trece deja la cel de 22nm. Acest lucru inseamna cel mai probabil ca AMD va trebui sa practice niste preturi mici pentru ramane competitiv.


Pentru netbookuri

Pentru notebookuri si laptopurile ultraportabile, AMD va lansa o serie de procesoare noi pe la sfarsitul lui 2011 (noiembrie-decembrie). Noile procesoare vor fi facute folosind procesul de fabricatie de 28nm. Drept urmare, ele vor fi mai rapide si vor consuma mai putin curent fata de actualele procesoare din seria E si seria C. Printre imbunatatirile aduse de noile procesoare se numara dublarea performantelor grafice si introducerea de procesoare cu 4 nuclee de calcul pentru laptopurile ultraportabile.

Surse imagini: http://vr-zone.com/articles/ivy-bridge-should-work-in-h67-and-p67-motherboards/11077.html / http://www.kitguru.net/components/graphic-cards/carl/exclusive-amd-fusion-processor-picture/ / http://www.tomshw.it/cont/news/amd-mostra-i-chip-orochi-e-llano-belle-novita/26798/1.html / http://itfanat.com/7558.html