Procesoare grafice: detalii tehnice

Pipelines / Shaders (Vertex / Geometry / Pixel) sau CUDA cores

In esenta aceastea sunt un fel de mini-procesoare specializate in calcule matematice/geometrice care duc greul in procesarea informatiei grafice. Ele transforma instructiunile grafice 3D in imaginea care ulterior se afiseaza pe ecran. Cu cat un procesor grafic are mai multe shadere cu atat poate sa proceseze mai multa informatie si este deci mai puternic. Astfel, shaderele sunt un element definitoriu al performantelor pe care le ofera un procesor grafic/placa video.

Shaderele sunt intotdeauna grupate in “clustere”, care sunt practic unitatea de baza a arhitecturii unui procesor grafic. Exemplu: Arhitectura Nvidia pentru seria 400M si 500M foloseste clustere de cate 32 de shadere. Dar pot exista placi video care folosesc doar jumatate de cluster.

AMD (ATI) vs Nvidia

Pentru a evita confuziile in compararea placilor video AMD cu cele Nvidia, trebuie sa facem o mentionare foarte importanta. Nvidia foloseste intotdeauna shadere “puternice” sau complete. Acestea sunt shadere care pot sa faca toate tipurile de calcule specifice acestora. AMD in schimb foloseste shadere mai simple, mai mici si care sunt specializate pe un anumit tip de calcul geometric. De aceea, procesoarele grafice AMD au in fisa lor trecute mult mai multe shadere in comparatie cu procesoarele grafice Nvidia.

Astfel, pana la seria 6000 de la AMD (inclusiv), se poate spune in linii mari ca 5 shadere AMD sunt echivalentul a unui shader Nvidia. Exemplu: o placa video ATI Mobility Radeon 5650 cu 400 de shadere ar fi de fapt echivalentul unei placi video Nvidia cu 80 de shadere.

Se pare ca de la seria 7000 incolo, AMD isi va schimba putin arhitectura si astfel 4 shadere AMD vor fi echivalente cu un shader Nvidia.

Nvidia foloseste deseori in loc de denumirea clasica de “shader” denumirea de CUDA core. In esenta sunt acelasi lucru, doar ca tehnologia CUDA permite folosirea shadere-lor si la alte activitati diferite de cele de procesare grafica. Exemple de astfel de activitati ar fi acelerarea interactiunilor fizice, a calculelor pur matematice folosite in cercetare sau decriptarea de parole.

In cazul placilor video Intel, shaderele poarta  denumirea de “Execution Units” sau “EU” cores.

Arhitectura Fermi
In imagine este interiorul unui procesor grafic care foloseste arhitectura Fermi de la Nvidia (GTX 480 / GTX 480M / GTX 580 )

Texture mapping unit (TMU)

Acestea sunt tot niste unitati de calcul specializate care lucreaza impreuna cu shaderele si a caror treaba este sa calculeze ce culoare trebuie sa aiba fiecare pixel in functie de textura aplicata de programul/jocul 3D.

ROP – Render Output Unit – Raster Operations Pipeline

Aceste elemente din arhitectura unei placi video au rolul de a scrie si de a citi informatia de pe memoria video. Tot ele sunt responsabile pentru forma finala pe care o ia imaginea pe ecran, fiind ultimul stadiul pe care il efectueaza placa video in procesarea informatiei. Daca placa video dispune de multa memorie video, atunci va avea nevoie de multe unitati de acest gen pentru a putea folosi memoria video disponibila in mod eficient.

Scheme arhitecturii
Schema arhitecturii AMD folosita in placile video pentru laptopuri 6970M si 6950M (stanga) si schema arhitecturii Nvidia folosita in placile video GTX 480M / GTX 485M (dreapta)

Bus type

Acesta defineste tipul de memorie video pe care il poate folosi procesorul grafic. Poate sa fie GDDR2 (DDR2), GDDR3 (DDR3) sau GDDR5.

Bus width

Aceasta caracteristica reprezinta cantitatea de memorie pe care o poate accesa placa video pe ciclu de procesare. Cu cate este mai mare, cu atat placa video poate accesa mai multa memorie in acelasi timp. Astfel, un Bus mare de 256-bit sau 512-bit va pune foarte bine in valoare o cantitate mare de memorie video. De aceea, placile care au astfel de Bus-uri se bucura de 1 – 1.5 GB de memorie video. Majoritatea placilor video pentru laptopuri au Bus-uri de 128-bit si in general 512MB -768 MB sunt mai mult decat suficienti.

O alta consecinta a acestei specificatii tehnice este cantitatea de memorie care o intalnim la o placa video. Intotdeauna cantitatea de memorie este un multiplu al Bus-ului de memorie. Astfel o placa video cu un Bus de 384-bit nu va avea niciodata 1 GB de memorie video, fie va avea 768 MB fie 1536 MB.

DirectX / Shader Model

O explicatie simplista ar fi ca DirectX reprezinta un set de instructiuni care mediaza interactiunea dintre programe (in cazul de fata jocurile 3D) si componentele hardware care executa aceste programe. Fiecare versiune noua de DirectX are niste seturi noi de instructiuni, seturi care de multe ori necesita un nou gen de hardware care sa stie sa le interpreteze. Arhitectura hardware care suporta noile instructiuni poarta denumirea de “Shader Model”. Astfel placile video cu Shader Model 3.0 stiu sa foloseasca instructiunile implementate pana la DirectX 9.0, cele cu Shader Model 4.0 cele pana la DirectX 10.0, cele cu Shader Model 5.0 pana la DirectX 11 si asa mai departe.

Ar mai fi de mentionat ca fiecare joc este facut pe baza anumitor instructiuni DirectX si deci nu va putea rula decat daca placa video are implementata in arhitectura ei “Shader Model”-ul minim necesar acelei versiuni de DirectX.

Procesoarele AMD pentru laptop: Clasa medie

Procesoarele din clasa medie ofera un nivel satisfacator de performanta, la un pret pe care marea majoritate a consumatorilor si-l pot permite. Aceste procesoare au un consum situat in zona 25-35W, ceea ce inseamna ca pot oferi in jur 3 pana la 5 ore de utilizare atunci cand laptopul este alimentat de la baterie (depinde de capacitatea bateriei si modul de utilizare), iar sistemul de racire nu trebuie sa fie unul foarte performant. Producatorii pot astfel sa opteze pentru un sistem de racire mai ieftin care in final se reflecta intr-un pret mai mic al laptopului. Aceste motive fac ca majoritatea lapopturile de pe piata sa foloseasca procesoare din clasa medie.

AMD ofera o gama destul de larga de procesoare care se incadreaza in clasa medie, preturile variind de la €70 pana la €200 (incl. TVA). Mai departe vom expune ultimele doua generatii de procesoare pentru laptopuri oferite de AMD.


Platforma AMD® Notebook 2010

Un procesor AMD quad-core N930 (fata / spate) din platforma Notebook 2010

La fel ca platforma din 2009, platforma din 2010 este derivata din procesoarele pentru desktopuri (Phenom II) si foloseste tot un proces de fabricatie de 45nm, similar cu generatia precedenta. Platforma a fost anuntata in mai 2010, dar faptul ca AMD nu a reusit sa avanseze la procesul de fabricatie de 32nm in timp ce Intel vindea deja procesoare pe aceasta arhitectura de cateva luni, face ca in 2010 procesoarele AMD pentru laptopuri sa fie evident inferioare ca performanta. In comparatie cu Intel, s-ar putea spune ca un procesor pentru laptopuri Phenom II la 2.80 GHz  din generatia 2010 ofera o performanta asemanatoare cu a unui procesor Intel Core 2 (2009)  la 2.53 – 2.66 GHz sau a unui procesor Intel Core i3 (2010) la 2.13 – 2.26 Ghz. Cu toate acestea, constienti de limitari, AMD si-au stabilit preturile in concordanta cu performantele reale. Pretul procesoarelor AMD este in general egal sau mai mic cu cel al procesoarelor Intel de aceeasi performanta. Acest aspect precum si diversificarea ofertei de procesoare pentru laptopurile din clasa medie au determinat ca in 2010 mai multi producatori sa adopte platforma AMD Notebook 2010 in modelele de laptopuri oferite. Mai trebuie mentionat ca desi in 2010 Intel a cam renuntat la procesoarele din clasa medie cu un consum redus de curent (sub 25W) si cu frecvente reduse, AMD a decis totusi sa includa astfel de procesoare in oferta sa. Astfel AMD a introdus pentru prima data pe piata laptopurilor, procesoare cu patru nuclee fizice dar cu un consum de curent de sub 35 W (dar frecventa este de numai 1.60 GHz). In materie de functii speciale care optimizeaza performantele sau consumul de curent nu se poate spune ca AMD se remarca prin ceva in mod deosebit dar nici ca ar avea niste deficiente notabile.

Oferta AMD de procesoare pentru 2010*:

Nr. Denumire Procesor Memorie Cache Frecventa de baza Caldura degajata (TDP) Viteza memoriilor DDR3 Tehnologie Hyper-Threading Numar fizic de nuclee Pret** Lansat in (trimestru)
1 AMD Phenom™ II N970 2MB 2.20 GHz 35W 1333 MHz Nu 4 ~$230? T1’11
2 AMD Phenom™ II N950 2MB 2.10 GHz 35W 1333 MHz Nu 4 N/A T4’10
3 AMD Phenom™ II N930 2MB 2.00 GHz 35W 1333 MHz Nu 4 ~$210? T2’10
4 AMD Phenom™ II P960 2MB 1.80 GHz 25W 1333 MHz Nu 4 N/A T4’10
5 AMD Phenom™ II P940 / N940 2MB 1.70 GHz 25W 1333 MHz Nu 4 N/A T4’10
6 AMD Phenom™ II P920 2MB 1.60 GHz 25W 1333 MHz Nu 4 ~$195? T2’10
7 AMD Phenom™ II N870 1.5MB 2.30 GHz 35W 1333 MHz Nu 3 N/A T1’11
8 AMD Phenom™ II N850 1.5MB 2.20 GHz 35W 1333 MHz Nu 3 N/A T4’10
9 AMD Phenom™ II N830 1.5MB 2.10 GHz 35W 1333 MHz Nu 3 N/A T2’10
10 AMD Phenom™ II P860 1.5MB 2.00 GHz 25W 1333 MHz Nu 3 N/A T1’11
11 AMD Phenom™ II P840 / N840 1.5MB 1.90 GHz 25W 1333 MHz Nu 3 N/A T4’10
12 AMD Phenom™ II P820 1.5MB 1.80 GHz 25W 1333 MHz Nu 3 N/A T2’10
13 AMD Phenom™ II N660 2MB 3.00 GHz 35W 1333 MHz Nu 2 N/A T1’11
14 AMD Phenom™ II N640 2MB 2.90 GHz 35W 1333 MHz Nu 2 N/A Nu s-a mai lansat
Nr. Denumire Procesor Memorie Cache Frecventa de baza Caldura degajata (TDP) Viteza memoriilor DDR3 Tehnologie Hyper-Threading Numar fizic de nuclee Pret** Lansat in (trimestru)
15 AMD Phenom™ II N620 2MB 2.80 GHz 35W 1333 MHz Nu 2 ~$120 ? T2’10
16 AMD Turion™ II N570 2MB 2.70 GHz 35W 1066 MHz Nu 2 N/A T’11
17 AMD Turion™ II P650 2MB 2.60 GHz 25W 1066 MHz Nu 2 N/A T4’10
18 AMD Turion™ II N550 2MB 2.60 GHz 35W 1066 MHz Nu 2 N/A T4’10
19 AMD Turion™ II P560 2MB 2.50 GHz 25W 1066 MHz Nu 2 N/A T1’11
20 AMD Turion™ II N530 2MB 2.50 GHz 35W 1066 MHz Nu 2 N/A T2’10
21 AMD Athlon™ II N370 1MB 2.50 GHz 35W 1066 MHz Nu 2 N/A T4’10
22 AMD Turion™ II P540 / N540 2MB 2.40 GHz 35W 1066 MHz Nu 2 N/A T4’10
23 AMD Turion™ II P520 2MB 2.30 GHz 25W 1066 MHz Nu 2 ~$100? T2’10
24 AMD Athlon™ II N350 1MB 2.40 GHz 35W 1066 MHz Nu 2 N/A T4’10
25 AMD Athlon™ II P360 1MB 2.30 GHz 25W 1066 MHz Nu 2 N/A T1’11
26 AMD Athlon™ II N330 1MB 2.30 GHz 35W 1066 MHz Nu 2 N/A T2’10
27 AMD Athlon™ II P340 2MB 2.20 GHz 25W 1066 MHz Nu 2 N/A T4’10
28 AMD Athlon™ II P320 2MB 2.10 GHz 25W 1066 MHz Nu 2 N/A T2’10
29 AMD V-Series V160 0.5MB 2.40 GHz 25W 1066 MHz Nu 1 N/A T1’11
30 AMD V-Series V140 0.5MB 2.30 GHz 25W 1066 MHz Nu 1 N/A T4’10
31 AMD V-Series V120 0.5MB 2.20 GHz 25W 1066 MHz Nu 1 N/A T2’10

* procesoarele sunt ordonate de la cel mai performant la cel mai putin performant in functie de specificatiile tehnice
** pret de fabrica: fara taxe de import, TVA etc. Datorita faptului ca unele modele de procesoare nu se mai fabrica sau au fost inlocuite de modele mai noi, este foarte posibil ca in prezent acestea sa se gaseasca pe piata la preturi un pic mai mici decat cele oficiale.


Platforma AMD® Notebook 2009

Un procesor AMD M320 (2009)

Din punct de vedere al arhitecturii, platforma AMD din 2009 este derivata direct din procesoarele AMD pentru desktopuri (Athlon II si Turion II) iar procesul de fabricatie este de 45nm (la fel ca pentru Core™2). Adoptarea procesului de fabricatie pe 45nm a fost esential pentru ca AMD sa ramana competitiv fata de Intel care adoptase acelasi proces de fabricatie cu mai bine de 6 luni mai devreme. Performantele procesoarelor AMD sunt destul de bune, desi un procesor din aceasta platforma este un pic mai „lenes” fata de unul Intel Core™2 la aceeasi frecventa. Diferenta este cam de 200 de Mhz, adica un procesor pentru laptopuri AMD din 2009  care functioneaza la 2.40 GHz este echivalentul unui Intel Core 2 la 2.20 GHz. Din fericire, preturile practicate de AMD nu tin cont de frecventa ci de performantele reale ale procesoarelor, iar in general procesoarele AMD sunt un pic mai ieftine decat procesoarele Intel de aceeasi performanta. In ciuda acestor aspect pozitive, pentru ca AMD este un brand mai putin „laudat” si pentru ca oferta sa de procesoare pentru laptopuri este destul de rastransa, in 2009 putini producatori de laptopuri au ales sa ofere pe piata laptopuri care au la baza un procesor AMD.

Oferta AMD pentru 2009*:

Nr. Denumire Procesor Memorie Cache Frecventa de baza Caldura degajata (TDP) Viteza memoriilor DDR3 Tehnologie Hyper-Threading Numar fizic de nuclee Pret** Lansat in (trimestru)
1 AMD Turion™ II Ultra M660 2MB 2.70 GHz 35W 800 MHz Nu 2 N/A T3’09
2 AMD Turion™ II Ultra M640 2MB 2.60 GHz 35W 800 MHz Nu 2 N/A T3’09
3 AMD Turion™ II Ultra M620 2MB 2.50 GHz 35W 800 MHz Nu 2 >$150? T3’09
5 AMD Turion™ II M560 1MB 2.50 GHz 35W 800 MHz Nu 2 N/A T3’09
4 AMD Turion™ II Ultra M600 2MB 2.40 GHz 35W 800 MHz Nu 2 >$150? T3’09
6 AMD Turion™ II M540 1MB 2.40 GHz 35W 800 MHz Nu 2 N/A T3’09
7 AMD Turion™ II M520 1MB 2.30 GHz 35W 800 MHz Nu 2 ~$100? T3’09
9 AMD Athlon™ II M360 0.5MB 2.30 GHz 35W 800 MHz Nu 2 N/A T3’09
8 AMD Turion™ II M500 1MB 2.20 GHz 35W 800 MHz Nu 2 N/A T3’09
10 AMD Turion™ II M340 0.5MB 2.20 GHz 35W 800 MHz Nu 2 N/A T3’09
11 AMD Athlon™ II M320 0.5MB 2.10 GHz 35W 800 MHz Nu 2 ~$75? T3’09
12 AMD Athlon™ II M300 0.5MB 2.00 GHz 35W 800 MHz Nu 2 N/A T3’09
13 AMD Sempron™ M140 0.5MB 2.20 GHz 25W 800 MHz Nu 1 N/A T3’09
14 AMD Sempron™ M120 0.5MB 2.10 GHz 25W 800 MHz Nu 1 N/A T3’09
15 AMD Sempron™ M100 0.5MB 2.00 GHz 25W 800 MHz Nu 1 ~$40? T3’09

* procesoarele sunt ordonate de la cel mai performant la cel mai putin performant in functie de specificatiile tehnice
** pret de fabrica: fara taxe de import, TVA etc. Datorita faptului ca unele modele de procesoare nu se mai fabrica sau au fost inlocuite de modele mai noi, este foarte posibil ca in prezent acestea sa se gaseasca pe piata la preturi un pic mai mici decat cele oficiale.

Surse imagini: http://media.bestofmicro.com/amd-mobile-processor,0-T-105005-13.jpg / http://www.pcwit.com / http://www.cpu-world.com/CPUs/K10/TYPE-Athlon%20II%20Dual-Core%20Mobile.html