Microprocesoarele



crMicroprocesoare PENTIUM IV



Pentium IV cunoscut si sub numele de cod Willamette, este cel mai nou model al familiei de microprocesoare Intel pe 32 de biti, care lucreaza la frecvente mai mari si inregistreaza performante superioare fata de modelele precedente.

Noua microarhitectura a acestor procesoare a fost denumita de catre Intel, NetBurst, in spatele acestei tehnologii aflandu-se urmatoarele noi facilitati:



busul sistemului la 400MHz - utilizand noua tehnologie ,quad pumped' cu o latime a magistralei de 64 biti si ceas de 100MHz, se ajunge la o rata de transfer intre procesor si memorie de 3200 MB/s, de 3 ori mai mare ca cea a procesoarelor Pentium III. Pentium III putea transfera doar 1.06G la o frecventa de 133MHz. Pentium IV lucreaza prin intermediul a doua canale de transmisie cu RDRAM, la o viteza de 3.2G/s.

Advanced Transfer Cache - se concretizeaza in marirea ratei de transfer a datelor intre memoria cache L2 si nucleul procesorului. Dimensiunea memoriei cache L2 este de 256KB. La schimbul de date cu sistemul (memorie, AGP, PCI) se folosesc blocuri de 64 bytes, ceea ce asigura o performanta mare pentru transferurile in rafala, iar conexiunea cu nucleul se face prin intermediul unei interfete de 256 biti, care poate transfera date la frecventa procesorului. Se obtine o largime de banda de 44.8GB/s pentru un Pentium IV la1.4GHz, aproximativ de 3 ori mai mult ca un Pentium III la1GHz.

Advanced Dynamic Execution - optimizari ale arhitecturii de prelucrare si stocare temporara a instructiunilor - mod speculativ si arbitrar de executie care impiedica procesorul sa aiba stari de stagnare cand instructiunile asteapta rezolvarea dependentelor, cum ar fi de exemplu incarcarea de date in memorie. Pot fi rulate astfel pana la126 de instructiuni in curs de rulare, fata de 42 in cazul microarhitecturii Pentium III. Execution Trace Cache - in cazul procesorului Pentium IV nivelul 1 de cache pentru instructiuni este pozitionat dupa unitatea de decodare. In acest caz nu mai este necesara redecodarea instructiunilor repetitive odata ce ele se afla in acest cache, in plus sunt mai usor de dedus dependentele in procesul de predictie. Poate contine pana la 12000 de microinstructiuni (comparativ este de 6 ori mai mare ca nivelul L1 de cache al unui PentiumIII ) si ofera spre executie 3 microinstructiuni la frecventa microprocesorului. Trace Cache-ul este un cache de instructiuni care incearca sa inregistreze instructiunile in ordinea lor de executie, ceea ce simplifica procesarea, asigurandu-se ca instructiunile sunt in ordinea corecta.

Un nou algoritm de predictie a instructiunilor, Enhancced Branch Prediction, cu un buffer in care se pot stoca 4096 de alternative, de 8 ori mai multe ca la un Pentium III, eliminandu-se astfel 33% din predictiile gresite in cazul procesorului mentionat anterior.

Unitatea de executie rapida asigura un nr mai mare de instructiuni -126, dintre sare unitatile de executie pot alege; acest lucru permite microprocesorului sa evite asteptarile care apar atunci cand o instructiune foloseste datele furnizate de o alta instructiune. Unitatea aduce si o mai mare acuratete in predictia salturilor (ranch prediction), rata de predictie gresita fiind cu 33% mai mica. Acuratetea este posibila datorita implementarii unui buffer de 4K ce stocheaza mai multe detalii despre ramurile accesate anterior, dar si datorita unui nou algoritm de predictie.

Hiper Pipelined Technology - dublarea fata de arhitectura PentiumIII a numarului de stadii pe care le parcurge o instructiune intre momentul intrarii in executie si obtinerea rezultatelor. Se obtine o crestere de performanta, dar avantajul principal este scalabilitatea in frecventa, procesoarele PentiumIV putand functiona la frecvente mult mai mari decat cele ale procesoarelor cu arhitecturi curente. Astfel, cu introducerea unei linii de asamblare in 20 de etape, Intel a reusit sa faca procesorul sa mearga la viteze foarte mari. In cazul unei instructiuni plasata pe o linie de asamblare in 10 etape, in timpul fiecarui impuls de ceas, o zecime este prelucrata si este nevoie de 10 cicluri de ceas pentru a termina. Deci, unei benzi de asamblare de la PentiumIV ii trebuie 20 de cicluri de ceas pt a termina o instructiune, in fiecare etapa prelucrarea fiind destul de redusa ceea ce diminueaza durata dintre 2 impulsuri de tact. Numarul total de cicluri necesare procesarii unei instructiuni se numeste timp de latenta. O linie de asamblare mai lunga inseamna timp de latenta mai mare.

Rapid Execution Engine - combinand inovatii ale arhitecturii interne si proiectarii fizice ale circuitelor, s-a reusit ca cele 4 unitati logice aritmetice simple (ALU) care executa microinstructiunile simple, sa ruleze la de 2 ori frecventa procesorului. Se incarca astfel 2 microinstructiuni la fiecare ceas procesor rezultand o durata totala de executie a unei instructiuni mult mai mica. Operatiile cu intregi sunt procesate de catre unitatile de executie pt intregi. In mod normal, o unitate proceseaza o instructiune numai in partea crescatoare a impulsului de tact, dar Pentium IV poate procesa si in partea descrescatoare a acestui impuls, reusind astfel sa dubleze viteza de lucru pentru anumite operatii cu intregi.

Streaming SIMD Extensions2 (SSE2) - extind capabilitatile MMX si SSE de la generatiile anterioare de procesoare cu 144 de noi instructiuni (SSE2) care pot opera cu pachete de date de 128 biti, numere intregi sau in virgula mobila cu dubla precizie. Aceste noi instructiuni reduc timpul necesar executarii programelor optimizate pentru ele. Ele accelereaza in special aplicatiile vide, audio, procesarile de imagini, aplicatiile tehnice si stiintifice. SSE2 inseamna 76 de noi instructiuni SIMD, ai exista in total 144de instructiuni pentru marirea performantei lucrului in virgula mobila si a aplicatiilor multimedia. Setul de instructiuni este destinat atat pentru intregi pe 128 biti cat si pt nr in virgula mobila dubla precizie, tot pe 128 biti. Datorita noilor instructiuni programatorul are o mobilitate mai mare deoarece acestea permit calculelor de tip SIMD sa fie efectuate in virgula mobila cat si pe intregi impachetati in registrele MMX. Prezentand o arhitectura cu totul noua, Pentium IV este destinat aplicatiilor multimedia si Internet, cum ar fi editare video, encodare si incarcare de materiale in format video pe Internet, encodare MP3 si aplicatii de vizualizare 3D. Pentru a rula astfel de programe, noua arhitectura a procesorului Pentium IV (NetBurst) contine o magistrala de date la400 MHz, noi tehnologii de realizare a memoriei cache si a canalului de date, alaturi de un set imbunatatit de instructiuni interne si un coprocesor matematic optimizat pentru aplicatii multimedia. Modificarile de arhitectura care au dus la imbunatatirea performantelor obtinute in aplicatiile de tip Internet (viteza superioara, canal de comunicatie mai mare, set nou de instructiuni SSE2, dimensiune redusa a memoriei cache, magistrala de date marita) nu se dovedesc la fel de benefice in cazul aplicatiilor uzuale. Astfel de programe obisnuiesc sa depuna mari cantitati de date in memoria cache si in plus, marirea magistralei de memorie la 3.2 GB pe secunda nu este atat de semnificativa pt aplicatiile de birou, acestea accesand de foarte multe ori memoria cache si nu memoria principala.

Pe masura ce dispozitivele microelectronice devin mai integrate, cu functii marite si niveluri de performanta mai ridicate, complexitatea solutiilor de impachetare creste proportional.

Ca rezultat al maririi caracteristicilor de integrare, frecventelor ridicate si al cerintelor de alimentare ale ultimei generatii de microprocesoare, densitatea de interconectari intre chipul procesorului si substrat a crescut remarcabil. Un nou tip de tehnologie cu un nou substrat de impachetare (factor de forma) este necesar pentru a beneficia din plin de progresele tehnologiilor pe silicon. Acest lucru a creat o serie de provocari in designul factorului de forma, dezvoltarea designului de substrat si a procesului de asamblare. Pentru a asigura un factor de forma de inalta integrare si un cost redus, a fost propus Flip Chip Pin Grid Array (FCPGA) ca solutie inovativa de impachetare. Acest factor de forma a fost proiectat ca o solutie socket. Factorul de forma FCPGA ofera nu numai o impachetare de inalta performanta, pe un substrat eficient din punct de vedere al costurilor ci si   foloseste in mod inteligent echipamentele de asamblare pentru a minimiza, per ansamblu, costurile de productie.

Actualmente, preturile microprocesoarelor PentiumIV variaza intre 150$ si 500$ fiind proportionale cu vitezele de prelucrare.