Jump to content

Recommended Posts

Posted

A fost un moment in istorie cand arhitecturile Intel si AMD erau comparabile din punct de vedere al performantei la aceeasi frecventa. Ma refer bineinteles la batalia crunta ce s-a dat acum mai bine de un deceniu intre Pentium III – la inceput a fost Katmai pe Slot 1, urmat de mai rapidul Coppermine pe Socket 370 – si Athlon – denumit Argon pe Slot A urmat de mai rapidul Thunderbird pe Socket A (462).

Concurenta pentru atingerea frecventei de 1GHz a fost acerba si a fost castigata de AMD, Athlon 1GHz fiind la un moment dat cel mai rapid procesor de pe planeta. In general procesoarele AMD Athlon erau mai rapide decat echivalentele de la Intel ruland la aceeasi frecventa dar aveau dese probleme de supraincalzire precum si instabilitati determinate de chipset-urile de cele mai multe ori imature (VIA, SIS, ULI sau chiar AMD).

slota-580x286.jpg

Chipset-urile Intel au fost considerate intotdeauna atuul procesoarelor Pentium III in lupta cu mai rapidul Athlon. Evolutiile lui Coppermine si Thunderbird s-au concretizat prin Tualatin si Thunderbird C. Cu Pentium III si Pentium III-S (512kB cache L2) bazate pe nucleul Tualatin, procesoarele Intel ofereau o performanta foarte buna la frecvente de pana la 1400MHz posibila datorita procesorului de fabricatie pe 130nm.

Athlon-ul ramane tot la nucleul Thunderbird pe 180nm dar prin revizia C AMD introduce FSB de 133MHz (10% performanta in plus fata de FSB 100) si perfectioneaza procesul tehnologic folosind acum interconnect-uri din cupru ce permite frecvente de pana la 1400MHz, pentru a concura cu Tualatin evident :D . Totusi, in acel moment combinatia Pentium III-S + chipset-ul Intel 815 era o combinatie extrem de reusita ce reusea sa depaseasca AMD Athlon. Acesta din urma nu prea a putut fi intalnit la frecvente peste 1200MHz din motive de caldura degajata si disponibilitate.

tualatin-580x461.jpg

Pentium 4 a fost evolutia fireasca, numai ca acesta se baza pe o arhitectura noua total diferita fata de arhitectura P6 introdusa de Intel o data cu lansarea Pentium PRO in 1995. Aflat in dezvoltare inca din 1998 atunci cand Pentium II era la moda, nucleul Willamette a fost lansat cu surle si trambite la data de 20 noiembrie 2000.

Desi rula la frecvente de 1.4GHz si 1.5GHz cu un FSB de 400MHz si memorie RDRAM, Pentium 4 nu reusea sa depaseasca cel mai rapid procesor la vremea respectiva – AMD Athlon 1200MHz. Situatia devenea si mai trista pentru ca era depasit si de Pentium III Coppermine 1.13GHz, iar in unele teste termina in spatele gamei mainstream a celor de la AMD, Duron.

Cu Netburst, Intel a mizat pe puterea bruta micsorand IPC (Instructions Per Clock) pentru a permite functionarea la frecvente mult mai ridicate decat cele permise de arhitectura P6. Automat, asta a insemnat latentele cache-urilor interne procesorului (L1,L2) relaxate precum si un pipeline mai lung, lucruri care nu au avut o influenta pozitiva asupra performantei.

willamette-580x580.jpg

Pentium 4 a avut parte de pareri impartite la lansare, anumite programe fiind optimizate pentru SSE2 (instructiuni introduse o data cu Netburst) permiteau obtinerea de rezultate foarte bune. Un alt aspect neplacut era consumul de energie precum si caldura degajata, acesta concurand cu succes procesoarele Athlon Thunderbird care erau faimoase pentru acest aspect.

Dupa jumatea anului 2001 si la inceputul anului 2002 Intel a decis sa induca cumparatorii si mai mult in eroare, lansand Pentium III Tualatin de care am vorbit mai devreme. Acesta era un produs mai performant decat Pentium 4 si beneficia de o placa de baza si memorii mai ieftine, ba chiar reusea sa castige in unele teste batalia cu Athlon Thunderbird C.

athlon_1400.jpg

Totusi, pana la sfarsitul anului 2001 Pentium 4 ajunsese la 2GHz fiind primul procesor ce a spart aceasta bariera. Inceputul anului 2002 a gasit Intel intr-o pozitie ceva mai buna, strategia de marketing ce implica frecvente mari impreuna cu lansarea chipset-ului 845 ce functiona cu SDRAM – memorii mult mai accesibile decat RDRAM – a facut ca Pentium 4 sa recupereze o buna cota de piata. Nu conta ca Willamette era gatuit masiv de SDRAM, cei 2GHz atrageau tot mai multa lume de partea Intel.

Palomino vs. Northwood

Vazand faptul ca batranul Thunderbird nu poate depasi limita de 1400MHz din cauza consumului extrem de ridicat, AMD a mutat decisiv in luna octombrie a anului 2001 lansat noul Athlon XP. Acesta beneficia acum de un rating ce il raporta la procesorul Pentium 4 de la Intel, desi AMD sustinea total altceva. Nucleul in cauza se numea Palomino si era bazat in pricipiu pe acelasi Thunderbird cu aceeasi tehnologie de fabricatie pe 180nm. Totusi, acesta beneficia de setul de instructiuni SSE preluate de la Intel Pentium III precum si de instructiunile proprii AMD: 3DNow! Professional.

Palomino-580x619.jpg

Optimizarile efectuate au permis un salt de performanta cu 10% peste Thunderbird in conditiile in care puterea consumata a fost redusa cu 20%. Pana in ianuarie 2002 AMD a lansat 4 modele: 1500+ (1.33GHz), 1800+ (1.53GHz), 1900+ (1.6GHz) si 2000+ (1.67GHz). In aceeasi luna ianuarie Intel lanseaza o noua revizie a nucleului Pentium 4, denumita Northwood. Dupa parerea multor analisti, acesta trebuia sa fie defapt Pentium 4 inca de la lansare…

Northwood a adus trecerea la procesul de fabricatie pe 130nm impreuna cu cresterea cache-ului L2 de la 256KB la 512KB. Simultan Intel a lansat si chipset-ul 845 cu suport DDR ce facea trecerea la Socket 478 si facea uitat atat vechiul Socket 423 cat si scumpa memorie RDRAM. Frecventele de lansare au fost 1.6GHz, 1.8GHz, 2GHz si 2.2GHz ceea ce a permis Intel sa fie din nou competitiv fata de Athlon XP, desi acesta era tactat cu cateva sute de MHz mai jos.

Intel Hyper-Threading si limitarile arhitecturii AMD EV6

In aprilie Intel a inceput sa lanseze procesoare bazate pe nucleul Northwood B cu FSB 533, aparand pe piata modele de la 2.53GHz si pana la 3.06GHz. Pentium 4 3.06GHz a fost primul procesor ce a beneficiat de tehnologia Hyper-Threading ce poate aloca 2 threaduri in paralel desi procesorul are un singur nucleu fizic. Totusi, Pentium 4 HT bazat pe revizia C a nucleului Northwood a pus cu adevarat in valoare potentialul arhitecturii Netburst. FSB 800 combinat cu viteze de la 2.4GHz pana la 3.4GHz si tehnologie Hyper-Threading a facut ca Intel sa preia din nou coroana performantei in majoritatea benchmark-urilor.

Northwood-580x636.jpg

Practic, in benchmark-urile de calcul masiv si randare Pentium 4 HT era cu pana la 50-70% mai bun decat echivalentul Athlon XP cu acelasi rating. AMD a incercat o fuziune de steroizi lansand pe rand Thoroughbred-A (Palomino 130nm die-shrink), Thoroughbred-B (imbunatatiri arhitecturale ce permit frecvente mai ridicate) si Barton (Thoroughbred-B cu 512KB L2 cache).

Thoroughbred-B a reprezentat un succes pentru AMD datorita pretului mic si potentialului ridicat de overclocking (>2200MHz usor), comparativ cu Pentium 4 HT care desi era mai performant la frecvente stoc era mult mai scump iar o data overclockat scalarea era mica din cauza IPC-ului scazut. Barton a fost un pas inainte dar cei 256KB cache suplimentar nu se justificau ca in cazul lui Pentium 4, sporurile de performante nu justificau de multe ori diferenta de pret.

Barton-580x619.jpg

In ceea ce priveste performanta Pentium 4 HT era mereu cu un pas inainte in ceea ce priveste performanta in conditii de frecvente stock, Athlon XP mentinandu-si excelentul raport pret / performanta. Nici cresterea frecventei de bus de la 133MHz la 166MHz mai apoi la 200MHz o data cu Athlon XP 3200+ nu a adus mari imbunatiri de performanta, se pare ca platforma DEC Alpha EV6 pe care se bazeaza arhitectura AMD K7 s-a apropriat de limita.

Athlon 64, sah mat pentru Pentium 4

La IDF 2003, cu o saptamana inainte de lansarea nucleului Clawhammer, primul componente al noii arhitecturi AMD K8 mai exact binecunoscutul Athlon 64, Intel a prezentat primul Pentium 4 Extreme Edition. Acesta era bazat pe nucleul Gallatin (adica un Northwood rev C cu 2MB de cache L3) rula la 3.2GHz si costa 999$. Cache-ul L3 aducea sporuri de performanta exact acolo unde arhitectura Netburst pierdea in fata AMD, adica jocuri si aplicatii multimedia. Sporul de performanta era atat de spectaculos incat reusea sa depaseasca si cele mai ieftine modele de Athlon 64 pe Socket 754.

p4ee-580x532.jpg

Dupa ce a lansat si varianta Extreme Edition tactata la 3.4GHz, Intel a lasat batranul Socket 478 sa se odihneasca lansand o noua platforma bazata pe Socket-ul LGA775 si un nou procesor EE. Este vorba de chipset-ul Intel 925X impreuna cu procesorul Pentium 4 Extreme Edition 3.46GHz, ce beneficia acum de memorie DDR2, FSB 1066MHz dar de acelasi pret – 999$. Totusi, acest procesor intra in istorie ca cel mai rapid procesor Pentium 4 construit vreodata (refresh-urile urmatoare cum ar fi Prescott sau Cedar Mill nereusind sa se apropie de el) acesta fiind si motivul pentru care am si eu unul in colectia personala.

In aceeasi perioada AMD lanseaza pe piata Socket-ul 939 ce beneficiaza acum – spre deosebire de Socket 754 – de memorie DDR dual-channel si HTT marit de la 800MHz la 1000MHz. Nucleele Winchester (512KB cache L2) si Clawhammer (1MB cache L2) sunt si ele la datorie, incorporand controller-ul de memorie in procesor fata de architectura K7 sau Pentium 4 unde acesta era in northbridge-ul placii de baza.

AMD FX-53 a fost primul procesor din seria FX destinat platformei S939, inaintea lui a fost FX-51 ce functiona pe platforma de server Socket 940 dar raspandirea lui a fost extrem de mica. Asadar, FX-53 era bazat pe nucleul Clawhammer cu 1MB cache L2 si avea multiplicatorul deblocat spre deosebire de Pentium 4 EE care era blocat. Pretul se invartea pe la 850$ fiind un pic mai ieftin decat competitorul de la Intel si mai bun in jocuri si aplicatii multimedia.

fx55-580x776.jpg

Cota de piata AMD a fost in continua crestere datorita raportului excelent pret / performanta oferit de procesoarele Athlon 64 cu 512KB cache ca 2800+, 3000+, 3200+ sau 3500+ bazate pe nucleul Winchester (130nm) sau incepand din 2005 pe die-shrink-ul Venice (90nm). Desi erau mai scumpe, procesoarele cu 1MB cache L2 si multiplicator blocat – adica non-FX – se vindeau foarte bine pentru ca prin overclocking se putea atinge nivelul unui Athlon FX in proportie de 99%. Nucleul Clawhammer folosit initial a fost inlocuit cu un die-shrink numit San Diego, folosit ulterior si in urmatoarele procesoare din seria FX: FX55 si FX57. Venice si San Diego nu erau doar un die-shrink, ci mai incorporau si setul de instructiuni SSE3 introdus de Intel o data cu lansarea nucleului Prescott.

Prescott, inceputul sfarsitului pentru Pentium 4

Pe 1 februarie 2004, Intel a lansat procesoarele Pentium 4 pe LGA775 bazate pe nucleul Prescott care beneficiau de mai multe noutati: instructiuni noi SSE3, cache L2 dublat ajuns acum la 1MB si proces de fabricatie pe 90nm cu strained silicon. Totodata a fost marita si lungimea pipeline-ului pentru a permite obtinerea de frecvente mai mari (de la 20 in cazul Northwood la 31 in cazul Prescott), problema este ca IPC-ul a scazut inca o data si nu putin de data asta.

Cu Prescott Intel si-a pierdut mult din competivitatea castigata o data cu introducerea Northwood sau Gallatin, dar au castigat cota de piata prin vanzarea masiva a sistemelor cu procesor “Intel la 3 giga’ “. Procesoarele Intel din vremea aceea rulau in intervalul 2.8GHz – 3.4GHz si erau depasite net de procesoare Athlon 64 ruland la 1.8GHz – 2.2GHz ce, culmea, erau mai reci si consumau mai putin . Nucleul Prescott 2M a fost lansat in Q1 2005, procesoarele Intel din seria 6XX primind un cache L2 marit la 2MB, EIST, XD Bit Disable si posibilitatea de a rula instructiuni pe 64 biti (Intel 64).

prescott-580x380.jpg

Simultan a fost lansat si un nou procesor din seria Extreme Edition, de data asta bazat pe nucleul Prescott 2M in loc de Gallatin si tactat la 3.73GHz. Problema era ca noul P4 EE 3.73GHz era depasit in majoritatea aplicatiilor de batranul P4 EE 3.46GHz, putine erau aplicatiile ce puteau beneficia de instructiunile SSE3 sau de viteza de executie bruta. E lesne de inteles ca competitorul direct din acea vreme, Athlon FX-55, un monstru ce functiona la 2.6GHz cu 1MB cache L2 il domina in toate testele.

Astazi, printre altele, vom recrea si lupta apriga data in 2005 intre AMD Athlon FX-55 si Intel Pentium 4 EE 3.73GHz folosind aplicatiile anului 2011 optimizate din plin pentru multithreading cu un sistem de operare pe 64 biti matur si optimizat (Windows 7 Enterprise x64 SP1). Va invinge o arhitectura eficienta ca cea a Athlon 64 sau Hyper Threading-ul prezent in Pentium 4 EE 3.73GHz il va ajuta sa spele rusinea suferita acum 6 ani? Vom vedea, dar inca nu vom trece la teste ca mai avem de povestit…

Era dual-core…

… incepe atunci cand Intel alatura doua nuclee Prescott le pune sub acelasi IHS si il numeste Smithfield, sau Pentium D pe numele lui de scena. Era foarte cald, consuma mult dar reusea sa bata in sfarsit Athlon 64 in majoritatea testelor de rendering si calcul multi-thread. Modelul Pentium Extreme Edition 840 (Smithfield XE) functiona la 3.2GHz, beneficia de multiplicator deblocat pentru overclocking facil si avea 2 nuclee si 4 fire de executie datorita tehnologiei Hyper-Threading. Restul procesoarelor din serie (820 si 830) nu aveau multiplicator deblocat si nici HT activat.

smithfield.jpg

Dupa cateva saptamani AMD lanseaza propriul dual-core, nucleele Manchester si Toledo prezentandu-se la apel fiind defapt doua nuclee Venice sau San Diego alaturate. Din nou AMD castiga teren datorita solutiei dual-core ce este considerata de majoritatea superioara celei de la Intel, lucru dovedit si in teste.

In ianuarie 2006 Intel face ultimul refresh al gamei Pentium 4 si Pentium D prin introducerea nucleelor Cedar Mill si Presler. Cedar Mill este die-shrink-ul pe 65nm a nucleului Prescott 2M care acum permite frecvente de aproape 5GHz folosind racirea cu aer si de peste 8GHz folosind azot lichid. Presler este varianta dual core ce integreaza doua nuclee Cedar Mill sub acelasi IHS.

AMD raspunde amenintarii date de Intel prin varful de lance Pentium Extreme Edition 955 (Presler XE) cu un nou procesor din seria FX dar de data asta dual-core: FX-60 bazat pe nucleul Toledo 90nm (die-shot mai jos) si functionand la 2.6GHz. Acesta a fost ultimul procesor AMD lansat pe batranul Socket 939, mai departe vor folosi Socket-ul AM2 trecand in sfarsit la memorie DDR2.

toledo.jpg

Desi performanta procesoarelor AMD echipate cu memorii DDR2 era aceeasi sau chiar mai mica cu cele echipate cu memorii DDR (in principal datorita arhitecturii K8 care beneficiaza mai mult de pe urma latentelor decat de pe urma latimii de banda) platforma AM2 oferea un consum de energie mai mic per total. Platforma AM2 nu a avut o popularitate prea ridicata, cel putin pana la lansarea procesoarelor din seria Phenom.

Motivul era sporul de performanta inexistenta fata de batranul si maturul Socket 939, dar AMD a abandonat vechea platforma lansand pana la sfarsitul anului 2006 procesoare cu rating-uri din ce in ce mai mari. Nucleul Windsor fabricat pe 90nm cu 1MB cache L2 per nucleu a urcat pana la 3200MHz (rating 6400+), in timp ce mai noul Brisbane fabricat in noul proces pe 65nm cu 512KB cache L2 per nucleu a urcat pana la 3100MHz (rating 6000+).

Intel Core 2, intoarcerea la origini

Din nou AMD a atins limita arhitecturii K8, procesoarele lansate pe AM2 nu erau decat niste refresh-uri si speed-bump-uri care au fost necesare pentru ca arhitectura K10 nu era inca gata. In august 2006 Intel a lansat primul dual-core nativ care reprezenta si intoarcerea la arhitectura P6, renuntand la “revolutionarul” Netburst care nu a dat rezultatele scontate.

Seria Core 2 Duo E6000 bazata pe nucleul Conroe este derivata din nucleul Dothan prezent sub numele de Pentium M pe laptop-urile din acea vreme (chiar si pe desktop-uri putea fi montat prin intermediul adaptorului CT-479 de la ASUS). Revenirea la arhitectura P6 a insemnat cresterea masiva a IPC-ului, procesoarele Core 2 Duo fiind eficiente la frecvente mici de lucru (~ 3GHz) si au un cache L2 de 4MB care este impartit intre cele 2 core-uri.

c2d-580x370.jpg

Nucleul Conroe si din ianuarie 2007 Allendale (aceeasi arhitectura dar cu cache L2 de 2MB) au permis Intel sa preia coroana performantei de la AMD care nu mai putea concura cu o arhitectura K8 veche de aproape 4 ani. Primul procesor quad-core a venit natural tot in luna noiembrie a anului 2006 prin alipirea a 2 nuclee Conroe XE sub acelasi IHS (varianta cu multiplicator deblocat a nucleului Conroe). Astfel a luat nastere nucleul Kentsfield XE lansat pe piata ca Core 2 Quad Extreme QX6700, un procesor monstruos cu 4 nuclee si multiplicator deblocat ce a inceput sa domine toate topurile de performanta

Core 2 Quad Q6600 si Core 2 Duo E6600 probabil ca au fost cel mai bine vandute procesoare Intel ale vremii, performanta lor nu putea fi egalata de nici un procesor AMD. Mai interesant decat performanta in conditii default era scalarea foarte buna in overclocking, majoritatea exemplarelor ajungand usor la 3800-3900MHz. Avand eficienta foarte buna per clock datorita IPC-ului mare, fiecare crestere de 100MHz avea un impact spectaculos in performanta spre deosebire de Pentium 4 care avea nevoie de un salt de 500MHz pentru a beneficia de aceeasi scalare.

AMD Phenom, K10 paseste cu stangul

Noiembrie 2007 ne aduce mult asteptatul nucleu Agena, primul procesor quad-core nativ bazat pe arhitectura AMD K10. Acesta avea numeroase imbunatatiri fata de arhitectura K8 printre care amintim cache-ul L3 de 2MB impartit intre cele 4 nuclee. Problema lor principala a fost frecventa mica de functionare (2200MHz pentru Phenom 9600) care il facea sa piarda in majoritatea testelor in fata lui Athlon 64 X2 6400+ ce rula la 3200MHz frecventa reala. Nici in overclocking Agena nu statea mai bine, bariera de 3GHz era extrem de greu de atins folosind racire conventionala.

agena-580x530.jpg

Pe langa problemele de performanta si frecventa, Phenom mai suferea si de TLB Bug care reprezenta o problema hardware la nivelul cache-ului L3 ce facea procesorul sa se blocheze atunci cand era stresat la maxim. Pentru procesoarele lansate initial bazate pe revizia B2 (Phenom 9500 si Phenom 9600) problema se putea rezolva din BIOS-ul placii de baza numai ca asta reducea performanta – care oricum nu era in parametrii – cu 10-20%.

In tabara adversa lucrurile stateau cum nu se poate mai bine, Intel castiga cota de piata vazand cu ochii in principal datorita performantei foarte bune a procesoarelor Core 2 dar si din cauza problemelor AMD cu Phenom. Intel profita de ocazie si lanseaza in a doua jumatate a anului 2007 un refresh pentru Core 2 Duo si Core 2 Quad, trecand nucleul Conroe si Kentsfield la revizia G0. Aceste noi revizii micsorau consumul de energie si sporeau overclocking-ul (acum frecvente de peste 4GHz folosind racire pe aer erau posibile).

Astfel, Intel pastreaza in productie pentru seria Extreme doar procesoare quad-core: Core 2 Extreme QX6800 (rev B3, 1066MHz FSB, 2.93GHz) si noul Core 2 Extreme QX6850 (rev G0, 1333MHz FSB, 3GHz). De asemenea, 3 noi procesoare dual-core au fost lansate folosind noua revizie G0: E6550, E6750 si varful de gama E6850.

c2q-580x538.jpg

Intel Penryn si AMD Agena B3

Penryn reprezinta pentru Intel trecerea la procesul de fabricatie pe 45nm, materializata prin Yorkfield XE (noiembrie 2007), Wolfdale (ianuarie 2008) si Yorkfield (martie 2008). Wolfdale era un Conroe fabricat pe 45nm cu un cache L2 marit la 6MB dar si cu cateva tweakuri de arhitectura, in timp ce Yorkfield alatura sub acelasi IHS doua pastile de Wolfdale. Diferenta dintre Intel si AMD in ceea ce priveste performanta tocmai s-a marit…

penryn-580x515.jpg

La sfarsitul lui martie 2008, AMD lanseaza versiunea revizuita a lui Phenom bazata pe nucleul Agena B3 fara faimosul TLB bug. Desi au fost lansate la frecvente mai ridicate, varfurile de gama din seria Phenom (9850 Black Edition ruland la 2.5GHz si 9950 BE ruland la 2.6GHz) se luptau sa prinda din urma cel mai ieftin quad-core de la Intel – Q6600. Yorkfield, chiar si mezinul Q9300, nu prea statea la discutii cu Phenom 9950 BE dar AMD avea de partea ei pretul; la 170 $ combinat cu o placa de baza bazata pe AMD 790FX era o alegere interesanta pentru cine isi dorea un procesor quad-core.

Core i7 si Phenom II

Lansarea lui Nehalem in noiembrie 2008 a marcat un nou pas in plus pentru IPC, aceasta fiind totodata si primul procesor quad-core nativ de la Intel. 4 nuclee si 8 fire de executie gratie tehnologiei Hyper-Threading cuplat cu memorii DDR3 triple-channel ofereau o performanta excelenta atunci cand aveam de-a face cu aplicatii paralelizate masiv. Sporul semnificativ de performanta a fost sustinut atat de cache-ul L3 impartit intre nuclee cu o capacitate de 8MB dar si de controller-ul de memorie integrat in procesor, ceva ce AMD folosea de la introducerea Athlon 64 in 2003.

nehalem-580x433.jpg

In ianuarie 2009 AMD lanseaza nucleul Deneb ce face parte din familia Phenom II bazata pe orginalul Phenom dar cu multe imbunatatiri: proces de fabricatie pe 45nm fara Cold Bug ceea ce l-a facut pe colegul meu Razvan sa-l numeasca “visul oricarui overclocker”, cache L3 de 3 ori mai mare ajungand acum la 6MB, functionare la frecvente peste 3GHz cu potential de overclocking peste 4GHz precum si numeroase imbunatiri structurale.

Da domnilor, Phenom II este exact ceea ce trebuia sa fie de la inceput arhitectura K10: reuseste sa depaseasca in sfarsit Kentsfield si se aproprie periculos de mezinele familiei Yorkfield. Din pacate performanta Phenom II nu se poate aproprie de cea a Nehalem, chiar si Core i7 920 este semnificativ mai rapid.

fullln2.jpg

Nucleul Deneb a vazut numeroase imbunatatiri: trecerea de la DDR2 la DDR3, numeroase cresteri de viteza ce l-au dus de la viteza initiala de 2.8GHz pana la 3.6GHz precum si schimbari de chipset (batranul 790 a cedat stafeta lui 890 urmandu-i apoi 990). Totusi, cea mai mare imbunatatire a fost adusa de revizia C3 care a reusit sa imbunatateasca overclocking-ul mediu de la 4.1-4.2GHz pana spre 4.7-4.8GHz.

Cu toate astea Phenom II s-a consacrat ca un procesor mainstream, acesta pierzand razboiul chiar si cu variantele consumer a Core i5 si Core i7 bazate pe nucleul Lynnfield sau Clarkdale. Desi imparteau in principale aceeasi arhitectura cu Bloomfield acestea integrau controller-ul PCI-Express in procesor castigand performanta in aplicatiile video cum ar fi jocurile.

Lansat in martie 2010 Core i7 980X cu nume de cod Gulftown a insemnat pentru Intel primul procesor cu 6 nuclee si 12 fire de executie. Era manufacturat folosind tehnologie pe 32nm si scala foarte bine cu tensiuni ridicate si temperaturi scazute. Din pacate la acel moment Intel nu mai concura cu nimeni la capitolul performanta pentru ca six-core-ul Phenom II X6 (Thuban) de la AMD se lupta din greu sa tina pasul cu Lynnfield (4 nuclee / 8 threaduri).

Si uite asa am ajuns cu povestea noastra in anul 2011 cand Intel a lansat in ianuarie arhitectura Sandy Bridge, o evolutie simtitoare clock-per-clock fata de Nehalem. Fiind fabricate pe 32nm acestea puteau functiona fara probleme la frecvente de peste 5GHz, devenind rapid alegerea numarul 1 pentru majoritatea cumparatorilor. AMD s-a rezumat doar a lansa speed-bump-uri la nucleele Deneb si Thuban, toata lumea asteptand cu sufletul la gura vestitul Bulldozer :D.

Bulldozer – AMD goes Netburst

Desi a profitat de greseala Intel pe vremea lui Pentium 4, AMD a facut aceeasi greseala in cazul Bulldozer. A optimizat arhitectura pentru lucrul la frecvente ridicate ceea ce a insemnat relaxarea latentelor si scaderea masiva a IPC-ului. Drept urmare performanta in aplicatiile single-thread a avut de suferit si nu a putut fi compensata nici prin frecventa foarte mare de functionare care urca pana la 4.2GHz.

Desi promovat ca un procesor cu 8 nuclee, Bulldozer este alcatuit defapt din 4 module fiecare dintre acestea fiind alcatuit din aproape doua nuclee. Prin urmare exista o singura unitate de fetch, una de decodare si una de alocare pentru operatii in virgula mobila in fiecare modul, dar cu doua zone de executie si doua unitati de alocare aferente pentru operatiile integer.

bulldozer-580x587.jpg

Teoretic AMD a implementat o tehnologie cu rezultate similare tehnologiei Hyper-Threading de la Intel numai ca din dorinta de promova Bulldozer ca primul procesor cu 8 nuclee nu a luat in calcul cum sistemul de operare se va comporta in acest caz. In situatia actuala, Windows vede procesor ca un octo-core si aloca sarcinile aleator pe cele 8 semi-nuclee.

Sa presupunem 2 fire de executie care au date comune si depind unul de celalalt, Windows-ul le va aloca pe nucleul 1 si 6 adica primul nucleu din primul modul si al doilea nucleu din al treilea modul. Performanta va avea de suferit pentru ca cele 2 nuclee nu pot comunica direct, performanta ar fi fost cu pana la 10% mai buna daca cele 2 fire de executie ar fi fost repartizate pe cele 2 nuclee ale aceluiasi modul.

Totusi, pentru ca acest lucru sa se intample Windows-ul va trebui sa vada procesorul ca un quad-core cu 8 fire de executie (similar HT) ceea ce ar pune AMD intr-o situatie extrem de neplacuta din punct de vedere legal… Acesta este si motivul pentru care patch-ul lansat de Microsoft sapatamana trecuta a fost retras in regim de urgenta :D.

Sandy Bridge-E preia coroana performantei

Acum ceva mai mult de o luna Intel a lansat pe piata Sandy Bridge-E care putem spune ca este pentru Sandy Bridge ceea ce Bloomfield este pentru Lynnfield – segmentul high-end al aceleiasi familii de procesoare avand aceeasi arhitectura de baza. Pentru a acomoda cele doua nuclee in plus, Sandy Bridge a suferit cateva modificari - evident, acceleratorul grafic a disparut din peisaj si in locul sau si-au facut loc doua nuclee.

Pentru a deservi aceste doua nuclee suplimentare, acum vorbim despre un sub-sistem de memorii quad-channel, in care procesorul este dotat cu doua controllere de memorie integrate. Pentru a face fata cantitatii sporite de date, ring-bus-ul este acum bi-directional, permitand circulatia instructiunilor in ambele sensuri. De asemenea, cantitatea de memorie cache LLC a crescut considerabil. Acest lucru implica si o crestere a latentelor, insa acest aspect poate fi discutat la nivel teoretic deoarece in practica nu pot sa spun ca am observat acest lucru.

O alta schimbare foarte importanta este cea operata asupra conexiunilor PCI-E: Sandy Bridge era dotat cu 16 lane-uri PCI-E 2.0 (o placa video la 16X sau doua placi video lucrand in regim 8X) in timp ce Sandy Bridge-E dispune de 40 de lane-uri PCI-E 3.0. Asta inseamna ca putem realiza configuratii quad-SLI sau quad-CrossfireX fara nici o problema, ceea ce este un lucru necesar pentru o platforma high-end.

sbe-DIE-580x516.jpg

Sursa: http://lab501.ro/procesoare-chipseturi/epic-cpu-battles-of-history-athlon-fx-55-pentium-4-ee-fx-8150-si-core-i7-3960x Mai găsiţi acolo şi nişte comparaţii foarte interesante.

  • Upvote 5
  • Downvote 1

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.