Tikslai:
1. Suprasti 5-8 kartų Intel procesorių raidos ypatumus.
2. Atpažinti architektūrinius ir technologinius sprendimus, įtakojančius procesorių funkcionalumo ir charakteristikų gerėjimą.
3. Lyginti tarpusavyje Intel procesorius.
Temos studijoms reikalingas laikas: 2 val. teorijos;
2 val. praktinio darbo
1 val. savarankiško darbo.
Pentium - tai x86 šeimos penktosios kartos mikroprocesoriai programiškai suderintas su ankstesniais Intel procesoriais.
Pirmieji Pentium šeimos atstovai buvo sukurti pagal BiKMOP technologiją su 0,8 mikrono 5 voltų įtampa ir turėjo savyje 3,1 milijonų tranzistorių. Nuo Pentium 120 MHz naudojama technologija KMOP, 0,35 mikronų ir maitinimo įtampa sumažinta iki 2,8V.
Skiriant nuo ankstesnių mikroprocesorių su x86 komandų sistema, Pentium šeimos procesoriai turi visa eilę technologinių naujovių, tarp kurių:
Ø Architektūra artima superskaliarinei;
Ø Atskiros komandų ir duomenų priešatmintinės;
Ø Nukreipimų nuspėjimas;
Ø Padidintos spartos operacijos su slankiu kableliu;
Ø Patobulinta 64-bitų duomenų magistralė;
Ø SL-technologija su galimybe valdyti energijos vartojimą;
Ø Daugiaprocessorinis darbas;
Ø Veikimo monitoringas;
Ø Skirtingų atminties puslapių dydžių palaikymas;
Struktūrinė procesoriaus Pentium schema pateikta 4.1. pav.
Superskaliarinis procesoriaus Pentium realizavimas – tai natūralus ankstesniųjų 32 bitų Intel procesorių modernizavimas.
Du procesoriaus Pentium konvejeriai gali vykdyti dvi komandas vienu metu. Pentium konvejeris vykdo komandas penkiais etapais:
išrinkimas
dekodavimas 1
dekodavimas 2
vykdymas
rezultato įrašymas
Tuo pačiu metu kelios komandos gali būti skirtingose vykdymo stadijose.
Bet du konvejeriai nėra nepriklausomi vienas nuo kito. Sustabdant vieną iš jų sustoja ir kitas. Aritmetinis slankaus kablelio blokas naudoja fiksuoto kablelio aritmetinį bloką veiksmams su eilėmis atlikti. O tai reikštų jog šios dvi operacijos negali būti vykdomos tuo pačiu metu. Tai riboja procesoriaus superskaliariškumą.
Procesoriuje Pentium daugybė mikrokodo komandų naudojamų ankstesniuose procesorių modeliuose yra pakeistos vidinėmis komandomis. Tai paprastos dažnai naudojamos komandos, kurias procesorius gali įvykdyti nenaudojant mikrokodo. Kas liečia sudėtingesnes komandas, tai patobulintas procesoriaus Pentium mikrokodas žymiai padidina našumą, naudojant komandų vykdymui du konvejerius.
Kiekviena procesoriaus Pentium priešatmintinė yra 8 KB. Priešatmintinės yra dalinai-asociativios. Reikiamos informacijos paieška vykdoma standartinėse 32-bitų eilutėse.
Adresų transliacijos buferis TLB (TransLation Buffer) pertvarko išorinės atmintinės ląstelės adresą į atitinkamą duomenų adresą priešatmintinėje.
Procesoriaus duomenų priešatmintinė naudoja atgalinio įrašymo tik pakeitus metodą (write back) ir MESI protokolą (Midified, Exclusive, Shared, Invalid). Įrašymo tik šalinant metodas leidžia modifikuoti duomenis priešatmintinėje be kreipimosi į operatyviąją atmintinę (duomenys įrašomi į operatyviąją atmintinę tik šalinant juos iš priešatmintinės).
Ankstesnėse kartose buvo naudojamas priešatmintinė su įrašymu vienu metu (write-through). Kiekvienos modifikacijos metu duomenys buvo perkeliami į vidinę atmintinę. Įrašymo tik šalinant metodas didina našumą, ir tuo pačiu mažina magistralės ir atmintinės apkrovimą.
MESI protokolo palaikymas leidžia užtikrinti duomenų suderinamumą procesorių priešatmintinėse ir atmintinėje dirbant multiprocesorinėje sistemoje.
Procesorius Pentium – pirmasis x86 suderinamas procesorius naudojantis šią technologiją, ankščiau ji buvo taikoma tiktai dideliuose ESM ir RISC procesoriuose.
Procesorius Pentium vykdo atšakų nuspėjimą naudojant BTB (Branch Target Buffer) buferį ir du pirminės atrankos buferius. Vienas buferis naudojamas pirminiam komandos išrinkimui, tariant jog atšakos nėra, kitas vykdo pirminį instrukcijų parinkimą į buferį, naudojant BTB turinį (pagal nukreipimo atsišakojimą).
Procesoriaus Pentium atšakų nuspėjimo algoritmas ne tik prognozuoja paprastų atšakų išrinkimą, bet ir palaiko sudėtingesnį prognozavimą (pavyzdžiui, įdėtuose cikluose). Tai galima dėka BTB buferyje saugojimų kelių atšakų adresų. BTB saugo iki 256 atšakų rezultatų, kas savo ruožtu leidžia vykdyti atšakų spėjimą ne mažesniu nei 0,8 tikslumu.
Procesoriuje Pentium naudojamas slankaus kablelio aritmetinis blokas, naudojantis sudėtingus aštuonių pakopų konvejerius ir vidines funkcijas. Dauguma slankaus kablelio komandų pradedama vykdyti viename iš sveiko skaičiaus konvejerių, o vėliau yra nusiunčiamos į konvejerius su slankiu kableliu. Be to, įprastos slankaus kablelio funkcijos (tokios kaip sudėtis, daugyba, dalyba) greitesniam jų vykdymui yra realizuotos kaip vidinės funkcijos.
Dėka šitokių naujovių procesorius Pentium-100 slankaus kablelio operacijas atlieka 10 kartų greičiau negu Intel 486DX 33MHz procesorius.
Dėka 64 bitų duomenų magistralės procesorius Pentium gali vykdyti duomenų mainus 528 MB per sekundę sparta. Tai daugiau nei 5 kartus viršija maksimalų procesoriaus IntelDX2 66MHz (105 MB/sek) duomenų mainų spartą. Praplėsta duomenų magistralė palaiko duomenų bei komandų srautą perduodamą superskaliariniam vykdomajam procesoriniam įtaisui, o tai skatina apdorojimo intensyvumo padidėjimą. Rezultate bendras procesoriaus Pentium-100 našumas 2,5 karto viršija procesoriaus IntelDX2 66MHz našumą.
Be duomenų magistralės praplėtimo tam, kad padidinti jos pralaidumą, procesorius Pentium realizuoja magistralės ciklų konvejerizaciją, leidžiančią pradėti antrą ciklą dar iki pasibaigs pirmas. Tai suteikia atmintinės posistemei daugiau laiko adreso dekodavimui, todėl galima naudoti lėtesnius ir pigesnius atmintinės elementus, o tai sumažina visos sistemos kainą. Be to, praleidžiamosios gebos ir sistemos patikimumui didinti didelę svarbą turi ir paketinio rašymo bei skaitymo palaikymas, adreso ir duomenų lygiškumo patikrinimas.
Tam, kad padidinti nuoseklių operacijų įrašymą į atmintinę, procesorius Pentium turi du įrašymo buferius (po vieną kiekvienam konvejeriui), dėka kurių, jis gali tęsti darbą (vykdyti kitas komandas), nepaisant to jog vienos jų rezultatas dėl magistralės užimtumo dar neįrašytas į atmintinę.
4.1 pav. Procesoriaus Pentium sandara
Tam kad padidinti sistemų, kuriamų procesoriaus Pentium pagrindu patikimumą, juose numatytos dvi priemonės, anksčiau naudotos tiktai didelėse ESM, - vidinis klaidų aptikimas ir testavimas panaudojant funkcinį likutį.
Vidiniam klaidų aptikimui naudojami vidinių procesoriaus buferių lygiškumo bitai.
Programoms, reikalaujančioms didžiausio patikimumo, gali būti naudojamas testavimas panaudojant funkcinį likutį. FRC (Functional Redundancy Checking). FRC reikalauja dviejų procesorių Pentium panaudojimo – pagrindinio ir tikrinančio. Tokiame tandeme procesoriai vykdo skaičiavimus paraleliai. Vienas procesorių tikrina skaičiavimų rezultatus su antrojo procesoriaus rezultatais. Atsiradus skirtumui rezultatuose, procesoriuose generuojamas pertraukčių signalas.
Pradedant procesorium Pentium 90, naudojamas naujas elektros energijos vartojimo valdymas. Elektros energijos tausojimo priemonės dirba procesoriaus ir sistemos lygmenyse. Energijos sąnaudų valdymas numatytas vykdant užduotis nereikalaujančias intensyvių skaičiavimų vykdymo (pavyzdžiui redaguojant tekstą), procesorius pervedamas į sumažinto taktinio dažnio režimą su sumažintu energijos panaudojimu. Galimas netgi visiškas procesoriaus sustabdymas (“miegantis” režimas – SL). Sistemoje Intel SL-technologija naudoja SMM (System Management Mode) sistemos valdymo režimą, kontroliuojantį energijos panaudojimą visoje sistemoje, netgi periferiniuose įrenginiuose. Valdymo priemonės leidžia procesoriui lėtinti funkcionavimą, laikinai arba visiškai stabdyti atskirų sistemos komponentų darbą maksimizuojant energijos taupymą.
Procesoriuje Pentium integruotos miltiprocesorinio duomenų apdorojimo priemonės, leidžiančios naudoti jį multiprocesorinėse sistemose.
Kaip jau minėta, tam kad palaikyti duomenų suderinamumą tarp įvairių procesorių, Pentium duomenų priešatmintinė naudoja MESI protokolą.
Procesoriai Pentium be to turi dvi naujas priemones multiprocesoriniam veikimui palaikyti: dviejų įėjimų priešatmintinės antro lygmens valdiklį, leidžiantį dviems procesoriams kartu naudotis viena antrojo lygio priešatmintine ir vidinį daugiaprocesorinių pertraukčių valdiklį, palaikantį iki 60 procesorių.
Našumo monitoringas – tai procesoriaus Pentium priemonė, leidžianti sistemos projektuotojams ir programinės įrangos kūrėjams optimizuoti jų produktus indentifikuojant programiniame kode “siauras vietas”. Projektuotojai gali stebėti ir skaičiuoti vidinių procesoriaus įvykių, turinčių įtakos rašymo ir skaitymo operacijų našumui, taktus, sėkmingus ir nesėkmingus kreipinius į priešatmintinę, pertrauktis, magistralės panaudojimą. Tai leidžia įvertinti programinio kodo efektyvumą Pentium architektūros atžvilgiu ir vykdyti tikslų taikomųjų paketų arba sistemų derinimą siekiant maksimalaus našumo.
Kaip ir visos naujos 32 bitų mikroprocesorinės Intel architektūros, procesorius Pentium leidžia modernizuoti sistemas pagal Intel modernizavimo technologiją. Tai prailgina sistemos eksploatavimo laikotarpį ir bent dalinai apsaugo įdėtas lėšas. Modernizacijos technologija leidžia panaudoti tobulesnių procesorių privalumus, garantuojant paprastą instaliaciją (dažniausiai paprastą lusto pakeitimą).
Procesorius Pentium MMX paveldi Pentium 1 privalumus ir kartu įgyja papildomų:
Ø Multimedija komandų rinkinį
Ø Padvigubintą duomenų bei komandų priešatmintinių talpą (16 KB kiekviena)
Ø Pagerintą atšakų nuspėjimo logiką
Ø Išplėstą konvejerizaciją
Ø Gilesnę įrašymo buferizaciją
Pentium MMX komandų išankstinio išrinkimo buferių jau 4 (po 16 baitų), tai leidžia vykdyti išrinkimą keturiomis nepriklausomomis kryptimis, o be to padidintas atšakų nuspėjimo tikslumas.
Kartu su minėtais patobulinimais pagrindiniu procesoriaus privalumu yra jo sugebėjimas palaikyti papildomą multimedija komandų rinkinį, kurio vykdymui naudojamas MMX-įtaisas ir slankaus kablelio registrų blokas. Ši technologija aptarta Modulio 2 trečiojoje temoje.
Pentium Pro
Tai Intel procesorius orientuotas į galingas darbo stotis turi integruotą L2 priešatmintinę ir iš AMD6 procesorių architektūros perimtą sudėtingų komandų keitimą į paprastų RISC tipo mikroopracijų seką.
Jame taikomos dinaminio vykdymo technologijos pagrindas - tai tokie našumą didinantys metodai, kaip išankstinis komandų vykdymas (spekuliatyvus vykdymas), komandų perrikiavimas ir atšakų nuspėjimas.
Nauja priešatmintinės architektūra – DIB – numato įvairių magistralių naudojimą sujungiant procesoriaus magistralę su priešatmintine ir pagrindine operatyviąja atmintine. Pirmoji magistralė dirba procesoriaus taktiniu dažniu, o antroji - sistemos taktiniu dažniu. Toks magistralių išskyrimas leido 3 kartus paspartinti procesoriaus ir atmintinės posistemės duomenų mainus.
Dėka to, atskira išorinė L2 priešatmintinė jau nebereikalinga. Procesorius turi atskiras pirmojo lygio priešatmintines (L1) duomenims ir komandoms, kiekviena po 8KB ir bendrą antrojo lygio priešatmintinę (L2). Pirmojo lygio duomenų priešatmintinė turi du prievadus, per taktą palaiko vieną įkėlimo ir vieną įrašymo operaciją. Antrojo lygio priešatmintinės sąsaja dirba centrinio procesoriaus taktiniu dažniu ir per taktą gali perduoti 64 bitus. Išorinė procesoriaus magistralė dirba ½, 1/3, arba ¼ procesoriaus lizdo taktiniu dažniu. Antro lygio priešatmintinės talpa – 256KB esant 0,6 µm ir 512 arba 1024 KB esant 0,35 mikronų technologijai.
512 elementų nukreipimo adresų buferis (BTB – Branch Target Buffer) leidžia sumažinti taktų skaičių komandų išrinkimo įtaisui (IFU – Instruction Fetch Unit) išrenkant eilutes iš priešatmintinės. Išrinkimo procesas konvejerizuotas. Nauja eilutė išimama per kiekvieną centrinio procesoriaus taktą. Trys lygiagretūs dekoderiai (ID) per kiekvieną taktą pertvarko kelias x86 architektūros komandas į mikrooperacijas rinkinius. Šį sprendimą Intel perėmė iš AMD K6 procesoriaus.
Registrų pseudonimų lentelė (RAT – Register Alias Table) naudojama registrų pervadinimui. Pervadinimo rezultatas nusiunčiamas į rezervavimo įtaisą (RS – Reservation Station) ir į pertvarkymo buferį (ROB – ReOrder Buffer).
Mikrooperacijos su pervadintais operandais rezervavimo įtaise (RS) sustatomos į eilę, kur jos laukia operandų reikšmių, ateinančiu nepriklausomai iš įvairių šaltinių. Duomenimis yra įvykdytų mikrooperacijų rezultatai, adresai iš BTB, registrų (EAX tipo) turinys.
Mikrooperacijų išrinkimas iš eilės ir dinaminis vykdymas atliekami atsižvelgiant į tikras priklausomybes pagal duomenis, o be to priklausomai nuo vykdomųjų įtaisų (IEU, FEU, AGU) užimtumo. Eiliškumas, kuriuo vykdomos mikrooperacijos, bendru atveju skiriasi nuo jų paskirstymo pradinėje programoje.
4.2 pav. Procesorius Pentium Pro (P6)
Planuojant kreipinius į atmintinę, naudojamas rezervavimo įtaisas, adresų generavimo įtaisas (AGU - Address Generation Unit) ir kreipinių į atmintinę eiliškumo buferis (MOB – Memory Ordering Buffer).
10.4. Pentium 2, Celeron ir Xeon procesoriai
Pentium 2 procesorius, dar žinomas Klamath vardu, suvienija geriausias ankstesniųjų modelių savybes. Didelis procesoriaus našumas pasiekiamas dėl naujų technologijų panaudojimo – dinaminio kodo vykdymo, MMX ir dvigubos nepriklausomos magistralės.
Procesoriaus architektūra pagal daugelį kriterijų artima Pentium Pro architektūrai, bet Pentium 2 (II) panaudotas pigesnis antrojo lygio priešatmintinės realizavimas. Pentium Pro brangumas paaiškinamas visų pirma tuo, jog gaminant gaunamas didelis broko procentas, nes pagaminus viename korpuse esančius priešatmintinę ir procesorių, kokybės kontrolę galima atlikti tik po visiško surinkimo ciklo. Pentium 2 panaudota pigesnė antrojo lygio priešatmintinė (BSRAM), kuri yra vienoje plokštelėje su procesoriumi. Dvigubos nepriklausomos magistralės architektūra, pirmąkart panaudota Pentium Pro procesoriuje, trys kartus padidina procesorinio lizdo duomenų mainų su atmintinės posisteme galimybes. Taip pat, kaip ir Pentium Pro, viena magistralė jungia procesorių su antrojo lygio priešatmintine, o antroji magistralė – su pagrindine operatyviąja atmintine. Bet pirmuosiuose Pentium 2 modeliuose darbo su antrojo lygio priešatmintine dažnis buvo lygus tik pusei taktinio procesoriaus dažnio.
Taip pat, kaip ir Pentium MMX, Pentium II turi multimedia operacijų vykdymo bloką, bet jo pirmojo lygio priešatmintinė praplėsta iki 32 KB (16 KB – keš komandų, 16 KB – duomenų priešatmintinė). Procesoriaus plokštė su L2 priešatmintine patalpinta į kartridžą su kontaktine S.E.C (Single Edge Contact) jungtimi, kuri įstatoma į plokštės lizdą Slot 1.
Pagal našumą pirmieji Pentium 2 modeliai su taktiniu dažniu 233, 266 ir 300MHz lenkė Pentium MMX, bet nusileisdavo Pentium Pro dėl lėtesnės antro lygio priešatmintinės. Bet jie buvo dukart pigesni nei Pentium Pro.
Tolimesnis procesorių Pentium 2 vystimasis vyko dviem kryptimis:
Pirmoji kryptis – procesoriaus kainos sumažinimas dėka antro lygio priešatmintinės atsisakymo (procesorius Celeron). Šie procesoriai orientuoti panaudoti pigiuose kompiuteriuose. Pravartu žinoti, jog visiškai atsisakius antrojo lygio priešatmintinės procesoriaus sparta žymiai sumažėjo. Vėlesniuose Celeron modeliuose pereinant prie 0,25 mikronų technologijos, 128 KB antrojo lygio priešatmintinę pavyko sutalpinti procesoriaus kristale. Pradėtas gaminti 1998 m..
Antroji kryptis – procesoriaus taktinio dažnio didinimas; priešatmintinės išplėtimas ir jos darbinio dažnio kėlimas iki procesoriaus branduolio darbinio dažnio; multiprocesorinės konfigūracijos palaikymas (procesorius Xeon).
Xeon gali dirbti 8-procesorinėje konfigūracijoje. Šie procesoriai skirti darbui galinguose profesionaliuose PK, darbinėse stotyse ir serveriuose.
Pentium 2 Xeon (1998 m.) turi tokias charakteristikas:
Ø skirtas serveriams, dažnis - 400 MHz;
Ø turi 512 KB, 1MB arba 2MB L2 priešatmintinę, prijungtą atskira magistrale;
Ø sistemos magistralė - 100 MHz;
Ø adresuojama atmintinė - 64 GB;
Ø virtualioji atmintis - 64 TB;
Ø branduolio tranzistorių skaičius - 7,5 mln (0,25 mm).
Procesorius Intel Pentium 3 ( Katmai ), išleistas 1999-ųjų pradžioje, paveldėjo geriausias P6 architektūros procesorių savybes: dinaminį komandų vykdymą, sisteminę magistralę su įvairiausiomis tranzakcijomis ir Intel MMX technologiją multimedija duomenų apdorojimui. Be to, procesoriuje Pentium 3 realizuoti nauji SIMD plėtiniai – 70 naujų komandų, garantuojančių pagerintas vaizdo, trimatės grafikos, audio ir vaizdo, kalbos atpažinimo apdorojimo galimybes.
Čia pateiktos pagrindinės techninės procesoriaus charakteristikos:
Ø Taktinis dažnis 550, 500 ir 450 MHz;
Ø Gaminant naudojamas 0,25 mikronų technologinis procesas;
Ø Į komandų sistemą kartu su MMX komandomis papildomai įtrauktos dar 70 naujų SIMD instrukcijų, kurios palengvina darbą su trimatės grafikos programomis, audio bei video signalų srautais, balso atpažinimu;.
Ø Pentium 3 procesorius dirbantis 500 MHz dažniu daugiau nei 93% viršija procesoriaus Pentium 2 su 450 MHz darbo našumą dirbant su trimate grafika;.
Ø Pentium 3 realizuota procesoriaus serijinio numerio funkcija. Tai – pirmasis sistemos komponentas personalinio kompiuterio saugumui užtikrinti, siūlomas korporacijos Intel.
4.3 (a) pav. Procesoriaus Pentium 3 sandara (sulietuvinta)
4.3 (b) pav. Procesoriaus Pentium 3 sandara (Intel žymenys)
Serijinis procesoriaus numeris – tai pirmas iš firmos Intel siūlomų personalinio kompiuterio saugumo komponentų. Būdamas unikaliu duotojo procesoriaus identifikatoriumi, gali būti panaudotas kompiuterio arba vartotojo identifikavimui tinkle arba taikomosiose programose. Serijinis procesoriaus numeris naudojamas šiuose paketuose, nes juose vartotojo arba sistemos indifikacija yra tiesiog būtina:
Ø Padidinto apsaugos lygio programos – valdomas priėjimas prie Internet tarnybų, dokumentų mainai;
Ø Resursų valdymas, nuotolinis sistemų įkrovimas, konfigūravimas ir valdymas;
Ø Informacinių resursų valdymas – techninio palaikymo tarnybos, rezervuojamų duomenų apsauga.
Ø
4.5.5. Procesoriaus Pentium 3 vidinės našumo kontrolės ir savitestavimo priemonės
Procesorius Pentium III turi aparatines vidines našumo kontrolės ir savęs testavimo priemones:
Ø Vidinis savęs testavimo mechanizmas (Buit-in Self Test –BIST) užtikrina nuolatinę pakibimų ir nusimušimų mikrokode ir didelėse loginėse matricose kontrolę, o taip pat keš komandų ir keš duomenų, TLB buferių ir ROM segmentų testavimą;
Ø Vidiniai skaičiavimo įtaisai seka našumo rodiklius ir vykdo įvykių skaičiavimą;
Ø Temperatūros jutiklis esantis sisteminėje plokštėje kontroliuoja procesoriaus Pentium III lusto temperatūrą, kurią būtina žinoti vykdant temperatūros režimo valdymą.
2000-ųjų lapkritį Intel kompanija pradėjo naujausio 32 bitų, procesoriaus, dirbančio 1,5 GHz taktiniu dažniu, gamybą. Šis įvykis labai svarbus, nes nuo Pentium Pro pagaminimo datos, Intel procesorių architektūros srityje nieko naujo nebuvo, jokių žymesnių pokyčių. Taigi, atsirado septintos kartos procesorius (Pentium Pro, Pentium II/III priklauso šeštai procesorių kartai – P6).
Pakanka išvardinti revoliucines Willamette branduolio naujoves:
Ø Žymiai pagerintą superskaliarinio mechanizmo versiją;
Ø Naująją antrojo lygio priešatmintinę, sekančią vykdomų instrukcijų tvarką;
Ø Perdirbtus operacijų blokus veiksmams su multimedija duomenimis ir slankaus kablelio skaičiais;
Ø Didžiulį naujojo instrukcijų rinkinio komandų skaičių;
Ø Naują 100MHz magistralę, per taktą perduodančią po 4 duomenų paketus ( kas emuliuoja sumarinį 400MHz taktinį dažnį);
Ø 20 pakopų instrukcijų vykdymo konvejeris.
4.4 (a) pav. Procesoriaus Pentium4 sandara (sulietuvinta)
4.4 (b) pav. Procesoriaus Pentium4 sandara (Intel žymenys)
Mikroarchitektūra Intel® NetBurst™ sąlygoja keletą jau aptartų naujų procesoriaus charakteristikų, tai hiperkonvejerinė technologija, sisteminė magistralė dirbanti 400MHz dažniu, priešatmintinė su komandų vykdymo stebėjimu ir greito komandų vykdymo blokas, taip pat kelios patobulintos funkcijos (priešatmintinė su pagerintu duomenų perdavimu (Advanced Transfer Cache); pagerinta dinaminio vykdymo technologija; papildytas operacijų su slankiuoju kableliu ir multimedijos blokas) ir srauto SIMD-praplėtimai SSE2.
Naujų funkcijų ir galimybių atsiradimas tapo galimas tik tobulėjant procesorių gamybos technologiniams procesams ir schemotechnikai, nes anksčiau jų nebuvo galima realizuoti gamybiniame lygyje. Žemiau aprašomi naujosios technologijos charakteristikos ir privalumai.
Hiperkonvejerinio apdorojimo technologija
Hiperkonvejerinio apdorojimo technologija leidžia dvigubai padidinti konvejerio gylį lyginant su, pagal architektūrą P6 pagamintu, procesoriumi Intel® Pentium® III. Išsišakojimų/grįžimų prognozavimo konvejeris architektūroje NetBurst™ realizuotas 20-ties pakopų konvejeriu (P6 architektūroje 10-ties pakopų). Naujos technologijos leidžia padidinti procesoriaus taktinį dažnį ir galią.
400 MHz sisteminė magistralė
Procesorius Intel® Pentium® 4 palaiko pačią našiausią sisteminę magistralę, leidžiančią procesoriui keistis duomenimis su kitais komponentais 3,2 Gb/s sparta. Tai vyksta signalų perdavimo schemos, organizuotos fiziniame lygmenyje, leidžiančios perduoti 4 kartus didesnį duomenų paketą 100MHz dažnio magistrale, o taip pat buferizacijos sistemų leidžiančių perduoti duomenis 400MHz dažniu, dėka. Atitinkamai procesorius Intel® Pentium® 3 keičiasi duomenimis 133MHz dažnio magistrale 1.06 GB/s sparta.
Pirmo lygio priešatmintinė su komandų vykdymo prognozavimu
Be 8 KB priešatmintinės, procesorius Pentium® 4 turi pirmojo lygmens priešatmintinę su komandų vykdymo sekimu, kurioje telpa 12000 dekoduotų mikrooperacijų išrikiuotų vykdymo tvarka. Tai padidina procesoriaus našumą, nes pagrindinių komandų sistemai tampa nereikalingas dekoderis ir greitoji atmintinė išnaudojama efektyviau. Galų gale pavyksta perduoti procesoriaus vykdymo blokams didelį komandų kiekį ir sumažinti laiką reikalingą grįžimui iš neteisingai prognozuotų atšakų.
Greitojo komandų vykdymo blokas (Rapid Execution Engine)
Du procesoriaus Pentium® 4 aritmetinės logikos blokai dirba dažniu 2 kartus viršijančiu procesoriaus taktinį dažnį. Tai leidžia pagrindines operacijas su sveikaisiais skaičiais (sudėtis, atimtis, loginis IR, loginis ARBA) atlikti dvigubu taktiniu dažniu. Pavyzdžiui 1,5 GHz dažnio procesoriaus Pentium® 4 greitojo komandų vykdymo blokas dirba 3 GHz dažniu.
256 KB greitoji antrojo lygio atmintis su pagerintu duomenų perdavimu
Greitosios antrojo lygio priešatmintinės su pagerintu duomenų perdavimu (Advanced Transfer Cache - ATC) talpa 256 KB. Ji procesoriui leidžia naudotis labai didelės duomenų perdavimo spartos kanalu tarp priešatmintinės ir procesoriaus branduolio.
"Hyper-threading" technologija leidžia sparčiau vykdyti programas, kurių funkcijos atliekamos kaip atskiri procesai, vadinami gijomis ("threads").
Hyper-Threading- daugiaprocesorinė sistema, bet virtuali. Procesorius yra tik vienas, o OS mato du. Kodėl?
Todėl kad į senesnio tipo procesorių yra įdėtas papildomas AS-IA32 blokas (Architectural State).
AS turi registrų rinkinį (bendros paskirties, valdymo, APIC, darbinių).
Fiziškai, AS#1 + vienintelis fizinis pagrindas (ALU, FPU, SIMD) sudaro loginį procesorių (LP1), o AS#2 + as pats fizinis pagrindas sudaro antrą loginį procesorių (LP2).
Kiekvienas LP turi savo valdiklį ir registrų rinkinį.
Tam kad teisingai išnaudoti abiejų LP registrus, naudojamos specialiosios lentelės - RAT (Register Alias Table), atskiras abiems LP.
4.5 pav. Daugiasrautės technologijos palyginimas su dviprocesorine sistema
Pirmieji pavyzdžiai 64 skilčių procesoriai Itanium pasirodė 2000 metų pabaigoje. Šis procesorius pagerina aukštos klasifikacijos serverių ir stočių darbą.
Itanium - pirmas procesorius turintis 64 skilčių IA – 64 architektūrą. Tai visai nauja mikroprocesoriaus architektūra naudojanti VLIW (Very Long Instruction Words) koncepciją. Jos dėka procesorius gali naudoti ilgus komandų vardus. Naujas lustas turi taip pat RISC ir CISC elementus.
Yra dar vienas procesoriaus architektūrinis sprendimas, kurį Intel firma pavadino EPIC (Explicity Parallel Instruction Computing). Naudojant šias komandas, procesorius gali atlikti kelias komandas ir veiksmus vienu metu.
Be šių naujų galimybių ir naujos 64 skilčių komandos, Intel ir Hewlett – Packard garantuoja pilną suderinamumą su žemesnės klasės procesoriais, nuo Itanium iki Intel x86 ir PA – RISC firmos Hewlett – Packard programins įrangos. Itanium procesoriuje yra sujungti trys skirtingi procesoriai į vieną, o tai reiškia, kad Itanium gali vienu metu vykdyti pagerintą, paralelinį programinį darbą su IA – 64, Windows (su IA – 32 architektūra) ir programomis HP – RISC UNIX.
Procesoriuje Itanium yra naudojamas naujo tipo Pin Array Cartridge (PAC) korpusas. Viso mikroprocesoriaus svoris – apie 170 gramų. Jis turi trijų lygių priešatmintinę: standartines pirmo ir antro lygio priešatmintines, ir dar trečio lygio priešatmintinę, kuri yra įstatyta atskirame kristale. Visa spartinančioji mikroprocesoriaus atmintinė yra procesoriaus korpuse.
Pagrindiniai architektūros ypatumai:
Ø Naudojamos paprastos fiksuoto ilgio komandos, sugrupuotos po tris;
Ø Procesorius komandų srautą pertvarko (pakeičia eilės tvarką) ir optimizuoja kompiliavimo metu;
Ø Spekuliatyviai vykdo abiejų šakų komandas;
Ø Išaiškėjus nukreipimo sąlygai, atmeta kitos šakos komandų vykdymo rezultatus;
Ø Spekulatyviai iš anksto įkelia duomenis iš atmintinės;
Ø Pirmiausia jų (duomenų) ieško priešatmintinėje.
4.6 pav. Procesoriaus Itanium sandara
|
Dviejų branduolių naudojimas - didžiausias lūžis procesorių rinkoje nuo pat "Intel 80386" pasirodymo laikų. Žinoma, būtina pastebėti, kad daug kas priklauso ir nuo programų kūrėjų bei to, kaip greitai jie pritaikys savo produktus dviejų branduolių procesoriams.
Dabar gaminami dviejų branduolių procesoriai paklūsta Moore'o dėsniui: viename luste sumontavus du branduolius, procesoriai veikia našiau, didėja tranzistorių skaičius colyje, o procesoriaus skleidžiamą šilumą galima kontroliuoti.
„Intel“ paskelbė kurianti daugiau nei 15 daugiabranduolinių procesorių, Tačiau nereiktų manyti, kad vieno branduolio procesoriai išnyks. Specialistai prognozuoja, jog į nebrangius kompiuterius jie bus diegiami dar ilgą laiką.
Dviejų branduolių procesoriuje įrengti du atskiri procesoriai ir dvi L2 spartinančiosios atmintinės. Teoriškai toks procesorius veikia lyg du atskiri įtaisai. Kompiuteryje su dviejų branduolių procesoriumi gerokai sparčiau veikia vienu metu sužadinamos programos, pritaikytos dviejų branduolių sistemai (pavyzdžiui, vienu metu ieškoma virusų ir naršoma internete).
„Smithfield“ branduolio pagrindu sukurtų „Pentium 4“ procesorių pavadinimas – „Pentium D“, o jų modelio pavadinimo pirmasis skaičius – „8“. Rinkoje pasirodė ir dviejų branduolių HT technologijos „Pentium Extreme Edition“ procesoriai (atvėrę „Windows Task Manager“ langą, matysime 4 loginius procesorius).
Kompiuterių salonuose pirmiausia radome keturis LGA775 lizdui pritaikytus dviejų branduolių „Intel“ procesorius: „Pentium D 820“ (taktinis dažnis – 2,8 GHz, priešatmintinė – 2 x 1 MB), „Pentium D 830“ (taktinis dažnis – 3 GHz, priešatmintinė – 2 x 1 MB), „Pentium D 840“ (taktinis dažnis – 3,2 GHz, priešatmintinė – 2 x 1 MB) ir „Pentium Extreme Edition 840“ (taktinis dažnis – 3,2 GHz, priešatmintinė – 2 x 1 MB, HT technologija).
Norint pagaminti dviejų branduolių procesoriaus pagrindu veikiantį kompiuterį, reikia naujos kartos pagrindinės plokštės. Kompiuterių salonuose jau galima pamatyti „Intel 955X Express“, „Intel 945P Express“ ir „NVidia nForce4 SLI – Intel Edition“ lustų pagrindu sukurtų plokščių.
10.8.1. Dviejų branduolių „Intel“ procesoriai pritaikyti 64 bitų technologijai
Jau anksčiau pasirodė naujos serijos dviejų branduolių „Pentium D“ lustai, veikiantys pagrindinėse plokštėse su 945 lustų rinkiniu.
4.7 pav. Plokštė su„Intel“ dviejų branduolių 3,2 GHz spartos procesoriumi „Pentium 4 Extreme Edition 840“
Nesitikėkite, kad dviejų branduolių procesoriai pralenks vieno branduolio įtaisus vykdydami dabartines žaidimų ir vienos gijos programas, tačiau viskas pasikeis tada, kai programos bus perrašytos. Pavyzdžiui, šių metų pabaigoje turėtų pasirodyti žaidimas „Unreal Tournament“, išnaudosiantis dviejų branduolių teikiamus privalumus.
4.8.1. Intel „Napa” platformaPagrindinis „Napa” platformos komponentas yra naujas procesorius kodiniu pavadinimu „Yonah”. Tai yra pagal 65 nanometrų technologinį procesą gaminamas procesorius – šiuo metu tai yra pažangiausia gamybos technologija, į tokio paties dydžio kristalą leidžianti sutalpinti gerokai daugiau tranzistorių nei naudojant 90 nm gamybos procesą.
Pažangesnė gamybos technologija leidžia sumažinti gamybos išlaidas, nes iš to paties dydžio silicio plokštės pagaminama kur kas daugiau procesorių. Dėl tos pačios priežasties pagal 65 nm technologiją pagamintų dviejų branduolių „Yonah” procesorių kristalas yra nedaug didesnis (90,3 mm2) už vieno branduolio „Dothan” procesoriaus, gaminamo pagal 90 nm technologiją (83,6 mm2). „Yonah” procesoriaus kristale sutalpinta net 151,6 mln., antrosios „Centrino” kartos „Dothan” lustuose – 140 mln., o pagal 130 nm technologiją gamintų pirmosios „Centrino” kartos „Banias” procesoriuose – „tik” 77 mln. tranzistorių. Be to, 65 nm gamybos technologija leido pasiekti labai priimtiną energijos suvartojimo lygį – maksimalus dviejų branduolių procesorių energijos suvartojimas tėra 31 vatas. Tai yra tik 4 vatais daugiau nei reikėjo greičiausiems „Dothan” procesoriams, kurie vartojo 27 vatus. Vien tik pažvelgus į energijos suvartojimą, bet neminint kitų energijos taupymo priemonių, galima daryti objektyvią prielaidą, kad naujuosius procesorius naudojančių kompiuterių autonominio darbo trukmė turėtų būti panaši į ankstesnės kartos.
Itin lengviems ir mažai energijos vartojantiems kompiuteriams dviejų branduolių procesoriai taip pat bus prieinami. Tokiems kompiuteriams skirti du lustai, kurių maksimalus energijos suvartojimas siekia 15 vatų: tai yra 1,66 GHz spartos „Core Duo LV L2400” ir 1,5 GHz spartos „Core Duo LV L2300”. Žinoma, palyginti su 1,5 GHz „Pentium M 758 LV”, kurio energijos sąnaudos yra 10 W, ar 1,2 GHz „Pentium M 753 ULV”, kurio darbui viso labo reikia 5 W, ekonomiškųjų „Core Duo” procesorių energijos sąnaudos yra pastebimai didesnės.
Dėl „Smart Cache” technologijos du „Core Duo” procesorių branduoliai dalijasi ta pačia 2 MB antrojo lygio priešatmintine. Tuo tarpu staliniams kompiuteriams skirti 900-osios serijos „Intel Pentium D” procesoriai kiekvienam branduoliui naudoja po atskirą 2 MB dydžio antrojo lygio priešatmintinę (800-osios serijos procesoriai naudoja po atskirą 1 MB dydžio antrojo lygio priešatmintinę). Mobiliuosiuose procesoriuose panaudotos „Smart Cache” technologijos privalumai turėtų išryškėti abiem branduoliams vienu metu dirbant ties ta pačia užduotimi, nes tokiu atveju abu procesoriai gali naudotis tais pačiais bendroje priešatmintinėje saugomais duomenimis.
„Dynamic Cache Allocation” leidžia išnaudoti maksimalų spartinančiosios atminties kiekį, prašomą konkrečios programos. Taigi spartinančiosios atminties naudojimas tarp branduolių pasiskirsto dinamiškai – kuriam tuo metu daugiau reikia, tas daugiau ir gauna. Iš anksto numatyto ar fiksuoto dydžio, kiek priešatmintinės turi būti skirta vienam ar kitam branduoliui, nėra. Be to, kai kompiuteris nėra apkrautas, taupant energiją ši technologija leidžia išjungti nenaudojamas priešatmintinės dalis.
„Dynamic Power Coordination” sumaniai kontroliuoja procesorių spartą, priklausomai nuo apkrovos. Ankstesnės kartos mobiliuosiuose procesoriuose ši technologija žinoma „Enhanced SpeedStep” vardu. Dabar, vienu metu veikiant dviem branduoliams, ši energijos taupymo technologija buvo patobulinta ir pavadinta „Dynamic Power Coordination”. Minimalus naujųjų procesorių darbo dažnis yra 996 MHz (166 MHz magistralės dažnis padaugintas iš minimalaus daugiklio – 6x).
Po „Digital Media Boost” vardu slepiasi mikroarchitektūriniai patobulinimai, įskaitant įvairių instrukcijų optimizavimą bei spartesnį SSE2 (Streaming SIMD Extensions 2) komandų vykdymą. Be to, „Core Duo” procesoriuose atsirado 13 naujų instrukcijų, pavadintų SSE3 vardu. Pasak gamintojo, senų instrukcijų optimizavimas ir naujos instrukcijos bus naudingos dirbant bei pramogaujant su įvairiomis daugialypės terpės programomis (vaizdo ir garso apdorojimas, trimačiai žaidimai ir pan).
„Intel Advanced Thermal Management” technologija skirta procesoriaus ilgaamžiškumui padidinti ir nešiojamojo kompiuterio aušinimo sistemai optimaliai reguliuoti. Kiekvienas kaistantis procesoriaus komponentas turi atskirą šilumos daviklį, t. y. šilumos davikliai yra virš kiekvieno branduolio. Pasak „Intel”, turint abiejų daviklių rodmenis galima optimaliau kontroliuoti aušinimo sistemos darbą. Tarp dviejų branduolių įdiegtas dar vienas šilumos daviklis, turintis apsaugoti jūsų procesorių nuo perkaitimo tuo atveju, jeigu sugestų kompiuterio aušinimo sistema.
Nepaisant to, kad marketingo karo lyderis visada būdavo kompanija Intel, tai dažnai neatspindėdavo realios situacijos. Paskutinieji AMD K8 architektūros kūriniai buvo kur kas pranašesni už liūdnai nuskambėjusios „NetBurst“ mikroarchitektūros kūrinius. Kuriant „NetBurst“ buvo orientuojamasi į pirkėjo “poreikį“, kitaip tariant į saldainio popieriuką, o ne į jo turinį. Skambus procesorių pavadinimas „Pentium 4“ ir buvo šios technologijos reprezentuotojas. Nors šie procesoriai ir pasižymėjo dideliais dažniais, tačiau aukštumų tikrai nesiekė, o kai buvo užsimenama apie jų kainą adekvačiam pirkėjui, pastarųjų įsigijimo šansai nukrisdavo iki nulio. Vis dėlto aukštas taktinis procesorių dažnis atrasdavo savo pirkėjus, kurie pirko ne našumą, o megahercus. Taip iki tam tikro laiko Intel sugebėjo išlaikyti savo pozicijas nepaisant nevykusių procesorių su dideliais specifikacijų skaičiais, tačiau palyginti mažu našumu. Aišku, ant laurų užmigusiai kompanijai teko atlaikyti neįtikėtiną AMD kompanijos atsakomąjį šturmą – „Athlon 64/X2“ procesorių pristatymą. AMD sugebėjo pirmieji pristatyti 64 bitų procesorius ir paleist į rinką visą seriją naujų vieno ir dviejų branduolių procesorių, kurie savo kainų segmentuose sudavė neįtikėtina smūgį Intel kompanijai. Kurį laiką AMD dominavo rinkoje taip visiškai išstumdama „NetBurst“ technologiją. Intel teko griebtis naujovių ir taip 2006 metais buvo pristatyta visiškai nauja mikroarchitektūra pavadinimu „Core“.
„Core“ architektūra buvo visiška „NetBurst“ technologijos priešingybė: maži dažniai ir didelis našumas. Naujosios architektūros atstovas, procesorius „Core 2 Duo“ E6300 su taktiniu dažniu 1,83GHz visuose testuose tiesiog nušlavė vieną iš galingiausių „NetBurst“ technologijos atstovų su dvigubai didesniu 3,6GHz taktiniu dažniu. AMD K8 architektūra taip pat sunkiai begalėjo pasipriešinti „Core“, todėl AMD pradėjo griežtą kainų mažinimo politiką, o ekstremalių procesorių segmento aukštumas užėmė Intel kompanijos kūriniai.
Iki šiol lyderio pozicijas rinkoje išlaiko Intel kompanija. Tiesa, po metų AMD pristatytą K10 architektūra kiek sušvelnino AMD atsilikimą, tačiau tinkamo atkirčio suduot negalėjo. Kol AMD tobulino K10 architektūrą Intel 2008 išleido dar vieną „Core“ mikroarchitektūros palikuonį „Nehalem“ procesorių, o visai nesenai pristatė dar vieną naują patobulintą architektūrą „Sandy Bridge“.
pav. Intel naudojamų procesorių lizdų kaita pradedant nuo 2009 metų (paimta iš www.intel.com)
Didžiausias trūkumas šių procesorių eroje yra procesorinių lizdų kaitaliojimas. Diagrama XX atvaizduoja Intel procesorių lizdų kaitą ir pasiskirstymą procentaliai pradedant nuo 2009 metų. „Core“ palaikė LGA 775 lizdą, naujai įvesta „Nehalem“ architektūra atnešė dar du papildomus lizdus, kurie skirstė „Core i7“ ir „Core i5/i3“ procesorius į skirtingo suderinamumo dalis. Dėl tokio Intel kompanijos ėjimo turint pagrindinę plokštę palaikančią „Core i5/i3“ procesorius negalima buvo atnaujinti sistemos įdėjus galingesnį „Core i7“ procesorių. Išleidus kiek patobulėjusią „Sandy bridge“architektūrą „Core i7/i5/i3“ procesoriams vėl buvo pakeistas lizdas. Taigi, šiuo metu rinkoje esantys procesoriai turi būti derinami netgi prie trijų lizdų: LGA 1366 („Nehalem“ architektūros „Core i7“), LGA 1156 („Nehalem“ architektūros „Core i5/i3“) ir LGA 1155 („Sandy bridge“ architektūros „Core i7/i5/i3“). Reiktų paminėti, kad buvo išleista „Core i7“ 800 serija, kuri yra suderinta LGA 1156, o ne su 1366.
Dar vienas svarbus Intel žingsnis – grafikos branduolio integravimas į procesoriaus kristalą. Šį privalumą turi „Sandy bridge“ šeimos procesoriai, tokiu būdu leisdami sistemose taupyti energiją naudojant integruotąją grafiką. Taip pat pagrindinei plokštei jau netenka rūpintis jungtimi tarp procesoriaus ir grafinio varikliuko, kuris ankščiau buvo diegiamas pagrindinės plokštės lustyne. Be to ši integruota vaizdo sistema leidžia save naudoti ir kaip papildomą. Kai naudojama 2D aplinka pagrindinė vaizdo plokštė atjungiama, o kai paleidžiamos sunkios 3D aplikacijos ji vėl įstoją į darbą.
„Sandy bridge“ architektūros naujovės
Sandy bridge lusto struktūrą galima padalint į tokias dalis:
· Procesoriaus branduoliai;
· Vaizdo branduolys;
· Trečiojo lygmens spratinančioji atmintis;
· Sistemos agentas (System agent).
Visi išvardyti elementai apjungti 256 bitų žiedinės magistralės pagalba, kuri sukurta senesnės QPI magistralės pagrindu.
Magistralė susideda iš keturių 32 bitų žiedų:
· Duomenų magistralė (data ring);
· Užklausų magistralė (request ring);
· Būsenos stebėjimo magistralė (snoop ring);
· Patvirtinimo magistralė (acknowledge ring).
Žiedinės topologijos, kuri realizuota „Sandy Bridge“ procesoriuose, pagrindiniai privalumai yra šie:
· Galimybė realizuoti viename luste iki dvidešimties branduolių, kurie veiktų be didesnių užlaikymų;
· Trečiojo lygmens spartinančiosios atminties vėlavimo laiko sumažėjimas ir darbo dažnio sinchronizavimas su procesoriaus dažniu;
· Vaizdo lustas geba naudoti trečiojo lygmens spartinančiąją atmintį.
„Sandy Bridge“ architektūros technologijos:
Intel® Turbo Boost Technology 2.0 (Intel spartinimo technologija) – technologija skirta tam, kad spartinti labiau apkrautus branduolius. Daugelis i5 ir i7 serijos procesorių turi po 4 branduolius, tačiau šiuolaikinės aplikacijos, žaidimai ne visada gali išnaudoti juos visus. Tam, kad bent kiek kompensuoti šį trukumą, technologija nuleidžia nenaudojamų branduolių dažnį iki mažiausio galimo, o naudojamų branduolių dažnius užkelia iki didžiausiai galimų taip paspartindama duomenų apdorojimą. Dažniai užkeliami iki tiek, kad nebūtų viršyti parametruose nurodytas išskiriamas šilumos kiekis.
Intel® Hyper-Threading Technology (Intel virtualių branduolių sukūrimo technologija)– HTT, tai Intel kompanijos technologija sukurta dar „Pentium 4“ procesorių laikais. Ji buvo panaikinta „Core“ architektūros procesoriuose, bet nesenai vėl buvo prikelta. Technologija dažnai teikia abejotiną naudą naudojant realioje aplinkoje. Jos esmė – virtualių branduolių sukūrimas, t.y. jų padvigubinimas. Tokiu būdu 4 branduolius turintis procesorius gali iš jų padaryti 8. Tai tas pats kas leisti žmones į stadioną pro dvejus vartus, tačiau pro vieną bilietų kasą – rezultatas bus tas pats, kaip kad ir su vienais vartais. Vis dėlto technologija kartais pasiteisina tokiose apdorojimo programose kaip „Photoshop“.
Intel® Smart Cache (Intel „protingoji“ spartinančioji atmintis) – Patobulinta ir greitesnė trečiojo lygmens spartinančioji atmintis, kuri paskirsto savo resursus tarp visų procesoriaus sudedamųjų dalių.
AES New Instructions (AES-NI) (Pažengusio dekodavimo standarto technologija) – Advanced Encryption Standart. Sistemos komandų rinkinio plėtinys x86 šeimos procesoriams 2008 metais sukurtas Intel kompanijos. Skirtas tam, kad greičiau susidoroti su aplikacijom naudojančiom AES kodavimą ir dekodavimą. Panašų sprendimą yra sukūrę ir VIA kompanijos atstovai, jis vadinasi „PadLock engine“.
Intel® vPro™ Technology – tai greičiau ne technologija, o technologijų rinkinys verslo kompiuteriams. Apjungia daugelį Intel apsaugos, spartinimo ir taupymo technologijų viename pavadinime. Tokiu būdu klientas gali suprasti, kad turės visą jo kompanijai reikalingą technologijų paketą. Dažniausiai „vPro“ tai ne tik procesorius, bet ir visa sistema, kurią sudaro:
· Procesorius su šios technologijos palaikymu;
· Daug integruotų komponentų turintis lustų rinkinys;
· Apsaugos technologijos (tokios kaip Intel AMT).
Namų vartotojams retai kada arba visai nereikalingas šis technologijų rinkinys.
Intel® Virtualization Technology (Intel virtualizacijos technologija) – AMD Virtualization technologijos analogas. Leidžia našiau, efektyviau ir saugiau dirbti su virtualiom aplinkom.
Iš šio skyriaus aiškiai matyti, kad Intel kompanijai puikiai sekasi vystyti savo procesorių gamybos ir pardavimo verslą. Nors ir yra susiduriama su kai kuriais smulkiais technologiniais nepatogumais, kaip kad dažnas lizdų kaitaliojimas vos tik atsinaujinus procesorių linijai, tačiau bendra situacija yra net gi labai puiki. Intel labai gerai tvarkosi kainų politikoje, o šios kompanijos gaminiai yra kol kas galingiausieji rinkoje ir neturi jiem galinčių pasipriešint analogų.
K10 – paskutinioji ir naujausia šiuo metu AMD kompanijos vystoma procesorių mikroarchitektūra. Ilgai laukta architektūrą jau buvo spėta pavadint mirusia, tačiau po ilgo laukimo 2007 metų gale buvo pradėti pirmųjų „Phenom“ (skirtų namų klasės vartotojams) ir „Opteron“ (skirtų serveriams) procesorių pardavimai. Deja, tokio ažiotažo kaip kad, kiek ankščiau anonsuota Intel „Core“ architektūra, K10 nesukėlė. Nors K10 atrodė šviežesnė, tačiau kaip parodė vėlesnės apžvalgos ir testai „Core“ nekiek nenusileido, o kai kur net ir lenkė savo konkurentę, tuo pat metu siūlydama palankius kainos/kokybės santykius.
Didžiausias „Phenom“ procesorių privalumas buvo lizdo suderinamumai, todėl kai kuriems pagrindinių plokščių turėtojams tam, kad įsidėti naują procesorių užtekdavo atsinaujinti BIOS versiją. Procesoriai skirti AM2+ lizdui galėjo būti įstatomi į AM2, tačiau taip pasielgęs vartotojas prarasdavo kai kurias naujai realizuotas technologijas. Viena iš jų HT (Hyper transport) magistralė. Naudojant AM2 lizdą tekdavo tenkintis jos senesne 2.0 versija, kai tuo tarpu AM2+ palaikė 3.0, kurios pralaidumas buvo kur kas didesnis nei įpėdinės. Sekantis nemalonus niuansas – trečiojo lygio spartinančioji atmintis. AM2 negalėjo palaikyti ir šios funkcijos. Taip pat vartotojui tekdavo atsisakyti kai kurių elektros energijos taupymo funkcijų.
Tolimesnis procesorių platformos atnaujinimas buvo nedidelis ir neįnešė daug pakeitimų, tačiau vienas aktualiausių AM3 lizdo pranašumų DDR3 tipo atminties palaikymas. Ir šį kartą AMD inžinieriams pavyko išsaugoti suderinamumą su AM2/AM2+. Svarbu pastebėti, kad seni procesoriai tiko į naujas platformas, tačiau naujų procesorių panaudojimas senesnėse AM2/AM2+ nebuvo galimas. AM3 turi dviem nepriderintais kontaktais daugiau negu jo pirmtakai. Populiarus, mano informacijos šaltiniuose paminėtas, tinklalapis „tomshardware“ atliko eksperimentą nulauždami du papildomus procesoriaus kontaktus ir įdėdami senesnį „Phenom“ procesorių į naują lizdą – kompiuteris neveikė. Tačiau įdėjus procesorių į seną lizdą, nepaisant nulaužtų dviejų kontaktų, procesorius veikė.
Didžiausiu K10 pranašumu prieš jo pirmtakę K8 architektūrą tapo keturių branduolių realizavimas vienam kristale, HT protokolo versijos atnaujinimas iki 3.0 versijos, trečiojo lygmens spartinančioji atmintis, o taip pat DDR3 atminties palaikymas (realizuotas ne iš karto).
Aktualios K10 architektūros technologijos:
Direct Connect Architecture (Tiesioginio prisijungimo architektūra)
Ypatumai:
· Leidžia padidint greitį ir efektyvumą susiedama atminties valdiklį ir įėjimo/išėjimo kanalą su branduoliu;
· Leidžia vienu metu atlikti 32 ir 64 bitų operacijas;
· Įneša integruotą atminties valdiklį DDR2 atminčiai (vėliau ir DDR3).
Privalumai:
§ Didesnis našumas gautas sumažinant kreipimosi į atmintį užlaikymą;
§ Paskirsto atminties magistralę priklausomai nuo užklausos tipo;
§ Technologija „Hyper-transport“ leidžia vykdyti sujungimą iki 16 GB/s greičiu tam, kad išvengtu užlaikymų;
§ Bendras pralaidumas tarp procesoriaus ir sistemos siekia 33,1 GB/s (įskaitant ir „Hyper-transport“ magistralę).
AMD Balanced Smart Cache (Pasiskirstanti trečiojo lygio spartinančioji atmintis)
Ypatumai:
· Realizuota bendra trečiojo lygmens spartinančioji atmintis, kuria gali naudotis visi branduoliai. Be to, kiekvienas iš jų turį atskirą antrojo lygio spartinančiąją atmintį, kuria naudojasi atkirai.
Privalumai:
§ Vėlavimų sumažinimas kreipiantis į dažnai naudojamus duomenis, tokiu būdu pagerinant spartą.
AMD Wide Floating Point Accelerator (Naujos kartos, užduočių su slankiojančių kablelių skaičiavimo, pagalbinis procesorius)
Ypatumai:
· 128 bitų FPU (Float point unit) kiekvienam iš branduolių.
Privalumai:
§ Greitesnis užduočių ir duomenų su slankiojančiuoju kableliu apdorojimas.
HyperTransport™ technology (AMD sisteminės magistralės technologija)
Ypatumai:
· Vienas 16 bitų kanalas veikiantis 4000Mt/s greičiu (2000MHz);
· „Hyper-Transport“ jungtis leidžianti pasiekti greitį iki 8GB/s ir iki 16GB/s dirbant su 3.0 versija.
Privalumai:
§ Greita prieiga prie visų sistemos resursų ir taip padidintas našumas.
Integrated DDR2 DRAM Controller with AMD Memory Optimizer Technology (Integruotas DDR2 atminties kontroleris(valdiklis) su AMD atminties optimizavimo technologija)
Ypatumai:
· Integruotas didelio pralaidumo ir mažų užlaikymų atminties valdiklis;
· Nebuferizuotos PC2-8500 (DDR2-1066); PC2-6400 (DDR2-800), PC2-5300 (DDR2-667), PC2-4200 (DDR2-533) и PC2-3200 (DDR2-400) atminties palaikymas;
· 64 bitų DDR2 SDRAM palaikymas;
· Pralaidumas iki 17,1GB/s.
Privalumai:
§ Greita prieiga prie visų sistemos resursų ir taip padidintas našumas.
AMD Virtualization™ (AMD-V™) With Rapid Virtualization Indexing (AMD virtualizacijos technologija su greituoju virtualizacijos indeksavimu)
Ypatumai:
· Funkcijų rinkinys sukurtas tam, kad padidintų saugumą ir spartą naudojant virtualizacijos aplinkas. Leidžia virtualiom mašinom tiesiogiai naudoti paskirtąją atmintį.
Privalumai:
§ Leidžia programom kurti našesnes ir labiau apsaugotas virtualias mašinas.
AMD Cool’n’Quiet™ 2.0 technology (AMD energijos suvartojimo ir išskiriamos šilumos sumažinimo technologija, „CnQ“ išvertus reiškia vėsu ir tylu.
Ypatumai:
· Patobulinta maitinimo kontrolės sistema, automatinis procesoriaus greičio reguliavimas priklausomai nuo apkrovos;
· Sumažintas procesoriaus suvartojamos elektros energijos kiekis ir aušinimo ventiliatoriaus apsukų skaičius laukimo būsenoje.
Privalumai:
§ Leidžia sistemai suvartoti mažiau elektros energijos, o taip pat sumažina aušinimo sistemos triukšmą.
Negalėdama pasiūlyti ypatingos spartos ir mažo procesorių suvartojamos elektros energijos kiekio, AMD kompanija pasirinko kitą būdą. Klientas turėjo galimybę „lanksčiai“ naudotis turimais procesoriais, mat jie dažnai buvo suderinami su naujom platformom. Taip pat labai stipri kainų politika neleido šiai kompanijai nepaisant nelabai vykusių procesorių, prarasti didelę rinkos dalį. Pigūs daugiabranduoliniai procesoriai dažnai rasdavo savo pirkėją.
Šiuo metu plačiai įsibėgėja nauja Intel architektūra pavadinimu „Sandy Bridge“. Iš esmės pastaroji yra „Nehalem“ architektūros paveldėtoja su kai kuriais patobulinimais. Kadangi architektūros yra labai panašios, tai nėra reikalo aprašinėti jas abi. Pagrinde dėmesį skirsiu būtent „Sandy Bridge“, bet kad parodyti jos naujoves trumpai palyginsiu su „Nehalem“.
pav. Tick-Tock strategijos realizavimo planas (paimta iš www.intel.com)
Šis paveikslėlis atvaizduoja Intel kompanijos strategijos „Tick-Tock“ planą. „Tick-Tock“ strategija reiškia, kad paeiliui yra atnaujinamos procesoriaus mikroarchitektūra ir procesoriaus kūrimo technologija kaip kad matome pavaizduotame paveikslėlyje. Kol kas Intel kompanijai puikiai sekasi vykdyti savo planus. Naujoji „Sandy Bridge“ procesorių architektūra gaminama pagal 32nm technologinį procesą. Prieš tai Intel šį technologinį procesą galėjo išbandyti su mobilių procesorių serija, „Nehalem“ architektūros antrininke, „Westmere“ architektūra.
Kartu su „Sandy Bridge“ architektūra Intel sugrįžo atgal prie dviejų kanalų atminties. Tokį žingsnį sunku paaiškinti. Nors didelės įtakos spartai tai ir nedaro, tačiau veikiausiai turėtų nuvilti visus pirkėjus, kurie jau anksčiau spėjo išleisti dideles sumas trim vienodos apimties atminties plokštelėm.
pav. Intel „Sandy Bridge“ mikroarchitektūros 4 branduolių procesoriaus lusto struktūra (paimta iš www.intel.com)
Naujasis „Sandy Bridge“ architektūros procesoriaus lustas (pavaizduotas 2.3 paveikslėlyje) savyje turi keturis branduolius, vaizdo branduolį, atminties valdiklį ir taip vadinamą „System Agent“, kuris jau buvo minėtas aukščiau. Tačiau pasikartosiu, kad jis sudarytas iš dviejų kanalų atminties valdiklio, PCI-e 2.0 valdiklio, maitinimo kontrolės modulio ir blokų, kurie atsako už vaizdo išvedimą jei yra naudojamas integruotas vaizdo branduolys.
pav. Intel „Sandy Bridge“ ir „Westmere“ lusto („Nehalem“ architektūra) palyginimas. (paimta iš www.intel.com)
Kaip matome esminis skirtumas tarp naujosios „Sandy Bridge“ ir senosios „Nehalem“ architektūrų, tai elementų realizacija. Šiuo aspektu „Sandy Bridge“ turi didelį pranašumą, nes šios architektūros lusto elementai nėra suskirstyti. Tuo tarpu „Nehalem“ architektūros lustuose branduoliai ir spartinančioji atmintis buvo visiškai atskirti vieni nuo kitų. „Sandy Bridge“ architektūroje realizuotas sprendimas leido sumažinti vėlinimo laiką elementam bendraujant tarpusavyje ir leido realizuoti naują žiedinę magistralę.
Visi lusto elementai apjungti greitaeige žiedine magistrale. Toks Intel inžinierių sprendimas turėtų padidinti duomenų apsikeitimo spartą tarp lusto komponentų. Taip pat toks apjungimo būdas leis ateityje apjungti iki 20-ties procesorių branduolių tiesiog pridedant juos į žiedą. Magistralė nėra vienalytė, ji suskirstyta į keturis „žiedus“, kurie buvo aprašyti aukščiau.
Dar vienas ne visais atvejais teigiamas aspektas yra integruotas branduolys. Šis sprendimas nėra visais atvejais malonus, nes branduolys nepriklausomai nuo procesoriaus modelio yra kiekviename iš jų. Toks žingsnis nėra visai logiškas, nes dažnas pirkėjas įsigydamas galingą procesorių orientuojasi į kokybišką grafikos pasaulį, o tam integruoto vaizdo tikrai nepakaks. Nors atrodytu, kad tokį “bonusą“ jus gaunat nemokamai, tačiau pažiūrėjus iš kitos pusės – jums bet kokiu atveju tenka mokėti už nenaudojamą vaizdo posistemę.
Be visų mano aprašytų dalykų 2.4 paveiksliuke pavaizduoti lusto privalumai: papildomi integruoti komponentai ir naudojamos technologijos, kurias jau buvau aprašęs anksčiau.
LLC (Low Latency Cache) – spartinančioji atmintis ir jos magistralė per kurią atliekamas visos sistemos bendravimas tarpusavyje.
Integruotas grafikos kristalas – kaip jau minėjau „Sandy Bridge“ architektūra yra ypatinga tuom, kad ją naudojantis kristalai savo sudėtyje turi ne tik procesorių ir jo komponentus, bet ir integruotą grafikos kristalą.
System agent – tai integruotas lustas atliekanti šiaurinio tilto funkcijas. Teikia x16 PCI-e liniją, kuri gali būti padalinta į dvi x8 PCI-e linijas.
Core – branduoliai, kurių 2.1 pav. yra keturi. Visi apjungti į žiedinę magistralę ir valdomi tam tikrų technologijų, tokių kaip HTT ir „Turbo boost“.
pav. „Sandy Bridge“ architektūros procesoriaus branduolio sandaros schema. (paimta iš www.intel.com)
Dar nuo „Core“ procesorių laikų Intel naudoja technologiją, kuri leidžia atjungti nenaudojamus procesoriaus blokus. Už tai atsakingas komponentas vadinamas „Loop Stream Detector“. „Sandy Bridge“ procesoriuose ši funkcija buvo patobulinta ir dabar nenaudojami blokai nėra išjungiami visai. Technologija tiesiog reguliuoja jų atliktą komandų ir instrukcijų skaičių, kas leidžia ne tik labiau sutaupyti elektros energijos, bet ir suteikia didesnį našumą. Tokį sprendimą galima buvo realizuoti naujojo makrokomandų buferio pagalba. Jis pilnai integruotas į pirmojo lygmens spartinančiąją atmintį.
pav. Mikrooperacijų dekoderio spartinančioji atmintis (paimta iš www.intel.com)
Patobulintas išsišakojimų nuspėjimo mechanizmas, vadinamas „Branch prediction unit“ (2.6 paveikslėlis) tapo dar labiau tikslesnis palyginus su ankstesniais procesoriais. Naujasis BPU savyje laiko dvigubai daugiau pilnutinių adresų ir ilgesnę komandų istoriją. Prie BPU prijungtas blokas, kuris tikrina sąveiką su „uop ceche“ bloku (tai spartinančiosios atminties tipas, skirtas mikrooperacijom), ko pasakoje procesorius gali lanksčiai valdyti integruotus dekoderius, spartinančiąją atmintį jų energijos vartojimo srityje. t.y. valdyti jų maitinimą.
pav. Planuotojas ir prievadai (paimta iš www.intel.com)
Komandų srauto formavimas keičiant eiliškumą. Paskirstymo, pervadinimo, planavimo ir duomenų išvedimo, konvejerinio apdorojimo procese „Sandy Bridge“ architektūroje, operacijos ženkliai pasikeitė. Ankstesnės architektūros naudojosi perrikiavimo buferiu (ROB, reorder buffer). Dabar „Sandy Bridge“ architektūroje mikrooperacijos fiksuojamos fizinio registrinio failo pagalba (PRF, physical registre file). Iš esmės „Sandy Bridge“ architektūroje ROB buferis naudojamas tik instrukcijų, kurios yra šiuo metu apdorojamos, sekimui. Tuo tarpu visos saugojimo funkcijos lieka PRF prerogatyva.
lentelė. Intel Sandy Bridge architektūros procesorių specifikacijų lentelė
Dekstop market – procesoriaus segmentas. Parodo kokiems vartotojams skirtas.
· Extreme/High-end – Galingiausi gaminiai
· Perfomance – Vidutinės klasės gaminiai
· Mainstream – Ekonominės klasės gaminiai
Socket – lizdo tipas
Cores (threads) – Branduolių ir srautų skaičius. Jeigu naudojama technologija HT, tada srautų skaičius būna dvigubai didesnis.
Processor branding and model – procesoriaus šeimos ir modelio pavadinimai.
CPU clock rate – procesoriaus dažnis
· Standart - Standartinis dažnis;
· Turbo – Taktinis dažnis gaunamas naudojant technologiją „Turbo boost“.
Graphics clock rate – vaizdo lusto darbo dažnis
· Standart - Standartinis dažnis;
· Turbo – Taktinis dažnis gaunamas naudojant technologiją „Turbo boost“.
L3 cache – trečiojo lygmens spartinančiosios atminties dydis.
TDP (Thermal desing Power) – maksimalus išskiriamos šilumos kiekis
Interface – Naudojamos magistralės (sąsajos) tipas.
Supported memory – procesoriaus palaikomos atminties tipas.
Release date and price (USD) – Procesoriaus pasirodymo data ir kaina doleriais.
Taigi, „Sandy Bridge“ architektūra neatnešė daug revoliucinių idėjų, tačiau puikiai įtvirtino Intel pozicijas rinkoje. Kaip matome 2.1 lentelėje naujosios architektūros procesorių pasirinkimo gama yra labai plati. Naujieji procesoriai yra našesni dėka puikaus vidaus modulių susisteminimo. Šį procesą realizuoti padeda žiedinė apjungimo architektūra. Taip pat procesoriaus lustas savyje tiesiogiai apjungęs ir vaizdo branduolį. Būtent tai leido atsisakyti papildomos magistralės naudojimo. Tai sutaupo laiko, kuris reikalingas kreipimuisi į procesorių. Be to patobulinti tokie moduliai kaip planavimas arba šakų nuspėjimas. Visą tai apsprendžia aukštą „Sandy Bridge“ architektūros našumo ir efektyvumo lygį.
10.10. SVK
Pentium 1
- Kodėl naudojamos atskiros duomenų ir komandų priešatmintinės?
- Kaip vykdomas dinaminis atšakų nuspėjimas?
- Kaip procesoriuje patobulinta 64 bitų duomenų magistralė?
- Kaip veikia duomenų vientisumo kontrolės sistema?
- Apibūdinkite SL technologija su intelektualiniu energijos panaudojimo kontroliavimu.
- Kas tai yra našumo monitoringas?
- Kokiomis priemonėmis pasiekiamas trumpesnis instrukcijų vykdymo laikas?
- Kam reikalingas ciklų konvejeris magistralėje?
Pentium MMX, PentiumPro
- Kas būdinga multimedija komandų rinkiniui?
- Kaip Pentium MMX pagerintą atšakų nuspėjimo logika?
- Kokį AMD procesorių sprendimą Intel panaudojo PentiumPro architektūroje?
- Ar pilnai pasiteisino L2 priešatmintinės integravimas procesoriuje?
Pentium 2
- Kas tai yra dinaminis kodų vykdymas?
- Paaiškinkite dvigubos nepriklausomos magistralės architektūrą.
- Kuo procesoriaus kartridžas su kontaktine S.E.C (Single Edge Contact) jungtimi, kuri įstatomas į plokštės lizdą Slot 1.
Pentium3
- Kas charakteringa SIMD komandoms.
- Kas tai yra procesoriaus serijinio numerio funkcija?
- Apibūdinkite Pentium 3 aparatines vidines našumo kontrolės ir savęs testavimo priemones.
Pentium 4
- Kaip Pentium 4 pagerinta superskaliarinio mechanizmo versija?
- Apibūdinkite SSE2 instrukcijų rinkinio komandas.
- Kaip Pentium 4 magistralė emuliuoja sumarinį 400MHz taktinį dažnį?
- Palyginkite Pentium procesorių instrukcijų vykdymo konvejerius.
- Procesorius su HT technologija iš tikrųjų tik vienas, o OS mato du. Kodėl?
Itanium
- Kas būdinga Itanium komandoms?
- Kada procesorius pertvarko komandų srautą (pakeičia eilės tvarką)? Ar procesorius vykdo abiejų šakų komandas ir kaip?
Dviejų branduolių procesoriai
- Kokie nauji architektūriniai sprendimai būdingi dviejų branduolių procesoriams?
- Kokios programos dviejų branduolių procesoriuose vykdomos sparčiau?
- Kas būdinga procesoriams orientuotiems į mobiliąsias technologijas?
1. Superskaliarinis procesoriaus Pentium realizavimas – tai natūralus ankstesniųjų 32 bitų Intel procesorių modernizavimas (vykdyti keletą operacijų iškart galėjo jau Intel 486 procesorius).
2. Du procesoriaus Pentium konvejeriai gali vykdyti dvi komandas vienu metu.
3. Aritmetinis slankaus kablelio blokas naudoja fiksuoto kablelio aritmetinį bloką veiksmams su eilėmis atlikti. O tai reikštų jog šios dvi operacijos negali būti vykdomos tuo pačiu metu. Tai riboja procesoriaus superskaliariškumą.
4. Kiekviena procesoriaus Pentium priešatmintinė yra 8 KB. Priešatmintinės yra dalinai-asociativios. Reikiamos informacijos paieška vykdoma standartinėse 32-bitų eilutėse.
5. Adresų transliacijos buferis (TLB) pertvarko išorinės atmintinės ląstelės adresą į atitinkamą duomenų adresą priešatmintinėje.
- Procesoriaus duomenų priešatmintinė naudoja atgalinio įrašymo tik pakeitus metodą (write back). Įrašymo tik šalinant metodas leidžia modifikuoti duomenis priešatmintinėje be kreipimosi į operatyviąją atmintinę (duomenys įrašomi į operatyviąją atmintinę tik šalinant juos iš priešatmintinės.
- Procesorius Pentium vykdo atšakų nuspėjimą naudojant BTB (Branch Target Buffer) buferį ir du pirminės atrankos buferius. Vienas buferis naudojamas pirminiam komandos išrinkimui, tariant jog atšakos nėra, kitas vykdo pirminį instrukcijų parinkimą į buferį, naudojant BTB turinį (pagal nukreipimo atsišakojimą).
8. Procesoriaus Pentium atšakų nuspėjimo algoritmas ne tik prognozuoja paprastų atšakų išrinkimą, bet ir palaiko sudėtingesnį prognozavimą (pavyzdžiui, įdėtuose cikluose). Tai galima dėka BTB buferyje saugojimų kelių atšakų adresų.
- Dėka naujovių procesorius Pentium slankaus kablelio operacijas atlieka 10 kartų greičiau negu Intel 486DX 33MHz procesorius.
- Be duomenų magistralės praplėtimo tam kad padidinti jos praleidžiamąją galią procesorius Pentium realizuoja magistralės ciklų konvejerizaciją, leidžiančią pradėti antrą ciklą dar iki pasibaigs pirmas.
11. Energijos sąnaudų valdymas numatytas vykdant užduotis nereikalaujančias intensyvių skaičiavimų vykdymo (pavyzdžiui redaguojant tekstą), procesorius pervedamas į sumažinto taktinio dažnio režimą su sumažintu energijos panaudojimu.
12. Galimas netgi visiškas procesoriaus sustabdymas (“miegantis” režimas – SL). Sistemoje Intel SL-technologija naudoja SMM (System Management Mode) sistemos valdymo režimą, kontroliuojantį energijos panaudojimą visoje sistemoje, netgi periferiniuose įrenginiuose. Valdymo priemonės leidžia procesoriui lėtinti funkcionavimą, laikinai arba visiškai stabdyti atskirų sistemos komponentų darbą maksimizuojant energijos taupymą.
- Procesorius Pentium MMX paveldi Pentium 1 privalumus ir kartu įgija papildomų iš kurių svarbiausias – MMX (multimedija komandų rinkinys).
- Nauja priešatmintinės architektūra – DIB – numato įvairių magistralių naudojimą sujungiant procesoriaus magistralę su priešatmintine ir pagrindine operatyviąja atmintine. Pirmoji magistralė dirba procesoriaus taktiniu dažniu, o antroji - sistemos taktiniu dažniu.
- Pirmoji Pentium2 įvairovės didinimo kryptis – procesoriaus kainos sumažinimas dėka antro lygio priešatmintinės atsisakymo (procesorius Celeron). Šie procesoriai orientuoti panaudoti pigiuose kompiuteriuose.
- Antroji Pentium2 įvairovės didinimo kryptis – procesoriaus taktinio dažnio didinimas; priešatmintinės išplėtimas ir jos darbinio dažnio kėlimas iki procesoriaus branduolio darbinio dažnio; multiprocesorinės konfigūracijos palaikymas (procesorius Xeon).
- Procesorius Intel Pentium 3 ( Katmai ), išleistas 1999-ųjų pradžioje, paveldėjo geriausias P6 architektūros procesorių savybes: dinaminį komandų vykdymą, sisteminę magistralę su įvairiausiomis tranzakcijomis ir Intel MMX technologiją multimedija duomenų apdorojimui. Be to, procesoriuje Pentium 3 realizuoti nauji SIMD plėtiniai – 70 naujų komandų, garantuojančių pagerintas vaizdo, trimatės grafikos, audio ir vaizdo, kalbos atpažinimo apdorojimo galimybes.
- Temperatūrinis jutiklis esantis sisteminėje plokštėje kontroliuoja procesoriaus Pentium III lusto temperatūrą, kurią būtina žinoti vykdant temperatūrinio režimo valdymą.
19. Procesorius Intel® Pentium® 4 palaiko pačią našiausią sisteminę magistralę, leidžiančią procesoriui keistis duomenimis su kitais komponentais 3,2 Gb/s sparta. Tai vyksta signalų perdavimo schemos, organizuotos fiziniame lygmenyje, leidžiančios perduoti 4 kart didesnį duomenų paketą 100MHz dažnio magistrale, o taip pat buferizacijos sistemų leidžiančių perduoti duomenis 400MHz dažniu, dėka.
- "Hyper-threading" technologija leidžia sparčiau vykdyti programas, kurių funkcijos atliekamos kaip atskiri procesai, vadinami gijomis ("threads").
- Itanium - pirmas procesorius turintis 64 skilčių IA – 64 architektūrą. Tai visai nauja mikroprocesoriaus architektūra, naudojanti VLIW (Very Long Instruction Words) koncepciją.
- Dar vienas Itanium procesoriaus architektūrinis sprendimas, kurį Intel firma pavadino EPIC (Explicity Parallel Instruction Computing). Naudojant šią technologiją, procesorius gali atlikti kelias komandas ir veiksmus vienu metu.
- Dviejų branduolių naudojimas - didžiausias lūžis procesorių rinkoje nuo pat "Intel 80386" pasirodymo laikų. Žinoma, būtina pastebėti, kad daug kas priklauso ir nuo programų kūrėjų bei to, kaip greitai jie pritaikys savo produktus dviejų branduolių procesoriams.
- Dabar gaminami dviejų branduolių procesoriai paklūsta Moore'o dėsniui: viename luste sumontavus du branduolius, procesoriai veikia našiau, didėja tranzistorių skaičius colyje, o procesoriaus skleidžiamą šilumą galima kontroliuoti.
- Dviejų branduolių procesoriuje įrengti du atskiri procesoriai ir dvi L2 spartinančiosios atmintinės. Teoriškai toks procesorius veikia lyg du atskiri įtaisai. Kompiuteryje su dviejų branduolių procesoriumi gerokai sparčiau veikia vienu metu sužadinamos programos, pritaikytos dviejų branduolių sistemai (vienu metu ieškoma virusų ir naršoma internete).
- Itin lengviems ir mažai energijos vartojantiems kompiuteriams dviejų branduolių procesoriai taip pat bus prieinami. Tokiems kompiuteriams skirti du lustai, kurių maksimalus energijos suvartojimas siekia 15 vatų: tai yra 1,66 GHz spartos „Core Duo LV L2400” ir 1,5 GHz spartos „Core Duo LV L2300”.
- Dėl „Smart Cache” technologijos du „Core Duo” procesorių branduoliai dalijasi ta pačia 2 MB antrojo lygio priešatmintine.
- Staliniams kompiuteriams skirti 900-osios serijos „Intel Pentium D” procesoriai kiekvienam branduoliui naudoja po atskirą 2 MB dydžio antrojo lygio priešatmintinę.
Tikslai:
1. Suprasti 5-8 kartų AMD procesorių raidos ypatumus.
2. Atpažinti architektūrinius ir technologinius sprendimus, įtakojančius procesorių funkcionalumo ir charakteristikų gerėjimą.
3. Lyginti tarpusavyje AMD ir Intel procesorius.
Temos studijoms reikalingas laikas: 2 val. teorijos;
2 val. praktinio darbo;
1 val. savarankiško darbo.
Su mikroprocesorių šeima Pentium pasaulinėje rinkoje sėkmingai konkuruoja kompanijos AMD sukurti Krypton (K-5, K-6, K-7, Athlon) bei naujieji Hammer šeimos procesoriai, turintys x86 komandų sistemą.
Ne vienerius metus kompanija AMD mikroprocesorių gamybos srityje atsilikinėjo nuo Intel’io visa mikroprocesorių karta ir tenkindavosi tik tuo, kad procesorius gamindavo naudodama licenzijuotas technologijas, tik įdiegdama keletą savo konstrukcinių patobulinimų. Atsiradus mikroprocesoriui Pentium, kompanijai AMD iškilo labai reali išnykimo grėsmė. Matydama pavojų būti visiškai išstumtai iš mikroprocesorių rinkos, AMD ėmėsi kurti visiškai naują mikroprocesorių šeimą suderinamą su x86 mikroprocesorių šeima. Užduotis buvo aiški: sukurti mikroprocesorių, kuris savo parametrais lenktų Intel’io Pentium’ą, ir tuo pačiu AMD galėtų atsikratyti amžino lyderių persekiotojo vardo.
Dar nuo 1990 metų Intel ir AMD bylinėjasi dėl mikroprocesorių mikrokodo, kurio architektūra x86, nuosavybės teisių.
K5 kūrimas prasidėjo dar tada, kai apie Pentium’ą nebuvo žinoma jokių smulkmenų. AMD inžinieriams teko patiems sukurti visiškai naują mikroarchitektūrą, kuriai turėjo tikti x86 šeimos programinė įranga.
K5 - tai pirmasis AMD procesorius, sukurtas nesinaudojant jokia Intel turima informacija (išskyrus mikrokodą x86), ir pirmasis, siūlantis didesnį produktyvumą, nei Intel procesoriai. Kaip teigia AMD, tokios programos, kaip Microsoft Excel, Microsof Word ar Corel Draw su mikroprocesoriumi K5 dirba 30% sparčiau, negu su tokio pat taktinio dažnio Pentium.
5.1 pav. Procesoriaus K5 superskaliarinis mechanizmas
Toks produktyvumas pasiektas dėl padidintos priešatmintinės ir progresyvesnės superskalirinės architektūros. Vietoje Pentium naudojamų sudvejintų konvejerių sveikų skaičių apdorojimui, K5 mikroprocesoriuje naudojama superskaliarinė architektūra su keturgubu komandų pateikimu, penkiais apdorojimo blokais ir RISC branduoliu su unikaliu x86 komandų dekoderiu.
Kaip žinoma, x86 komandos būna įvairaus sudėtingumo ir ilgio, dėl to dinamiškas jų vykdymas yra gana sudėtingas. Dekoderis, sudėtingiausia procesoriaus dalis, suskirsto ilgas CISC instrukcijas į nedidelius, panašius į RISC, elementus, taip vadinamus ROP (RISC operacijas). RISC operacijos panašios į mikroprocesorių x86 mikrokodo komandas. Pirmieji x86 architektūros procesoriai vykdė savo sudėtingus mikrokomandų rinkinius, ieškodami mikrokodo savo pastoviojoje vidinėje atmintyje. Paskutiniai x86 procesoriai mikrokodo beveik nebenaudojo, tai buvo pasiekta pradedant naudoti paprastas komandas. K5 mikroprocesoriuje naudojamas kitoks metodas: čia daugumą RISC operacijų dinamiškai generuojama ne mikrokodo, o dekoderio pagalba.
Tačiau mikrokodas vis dar naudojamas apdorojant sudėtingas ir retai naudojamas x86 komandas, tokias kaip operacijos su eilutėmis ir veiksmai su kompleksiniais skaičiais. Tačiau netgi ir šiais atvejais generuojamas RISC operacijų srautas. K5 gali konvertuoti x68 komandą į 1-4 RISC operacijas. Šių operacijų atlikimas planuojamas branduolyje, kuriame daug kas yra pasiskolinta iš RISC architektūros. Mikroprocesoriuje K5 panaudota hibridinė CISC/RISC technologija. Kad įgyvendinti dinaminį duomenų apdorojimą, naudojami tokie metodai: dinaminis registrų pervadinimas, nukreipimų spėjimas, vykdymo eiliškumo keitimas ir kiti.
Svarbi K5 ypatybė yra ta, kad vietoje dviejų lygiagrečių konvejerių operacijoms su sveikais skaičiais atlikti, jame yra 5 lygiagrečiai dirbantys blokai. Kaip ir Pentium, jis gali lygiagrečiai vykdyti dvi operacijas su sveikais skaičiais. Tačiau, skirtingai negu Pentium, K5 mikroprocesoriuje tuo pačiu metu taip pat gali būti vykdomos skaitymo/rašymo, nukreipimo instrukcijos, ar instrukcijos su slankiu kableliu. Didelis registrų kiekis ir skaitymo/rašymo blokas leidžia vieno išrinkimo iš atmintinės ciklo metu įvykdyti dvi operacijas. Dar vienas požymis, kuriuo K5 skiriasi nuo Pentium - K5 gali keisti atliekamų operacijų eiliškumą.
Operacijų su slankiu kableliu blokas (FPU) atitinka x86 standartus, tačiau yra šiek tiek lėtesnis, nei procesoriaus Pentium analogiškas blokas. Tačiau reikėtų pažymėti, kad šios operacijos personalinių kompiuterių programinei įrangai nėra labai reikšmingos ar svarbios (programinės įrangos, naudojančios operaciją su slankiu kableliu, yra nykstamai mažai).
Procesoriaus K6 planavimo blokas buferyje laiko 24 RISC86 komandas ir siunčia vykdymo instrukcijas 7 moduliams: įrašymo, nuskaitymo, nukreipimo, sveikų skaičių ALU, daugialypės terpės ir veiksmų su slankiuoju kableliu. Buferio buvimas įgalina planuotojui dinamiškai analizuoti ir keisti pasirinktą komandų vykdymo tvarką. Taip maksimaliai optimizuojamas vykdymo įrenginių valdymas.
1998 metų gegužės pabaigoje AMD pranešė apie savo naują produktą – mikroprocesorių K6 – II su superskaliariniu MMX komandų apdorojimu ir 3DNow! technologija, kurioje yra 21 nauja instrukcija, tarp kurių - pagreitinančios trimačių objektų vaizdavimą, palaikančios stereo garsą bei video. Tokios galimybės Intel mikroprocesoriuose buvo įgyvendintos žymiai vėliau, kai buvo išleistas procesorius Pentium III.
Pagreitintas apdorojimas, naudojant 3DNow! technologiją, gaunamas dėl to, kad vietoje įprastinių MMX komandų yra naudojamos analogiškos, bet dirbančios su slankaus kablelio formato duomenimis SIMD komandos. Kiekviena 3DNow! komanda gali dirbti su dviem slankaus kablelio formato operandais. Procesorius AMD K6 – II vieno ciklo metu, naudodamas du konvejerius, sugeba apdoroti dvi 3DNow! instrukcijas. Tokiu būdu vieno ciklo metu gali būti atlikti keturi veiksmai su slankaus kablelio operandais (sudėti, sudauginti ir atimti).
Procesoriaus AMD K6 – II daugialypės terpės blokas apjungia iki šiol buvusias MMX ir naujas 3DNow! instrukcijas. Toks instrukcijų apjungimas programoms leidžia vykdyti grafines MMX instrukcijas (sveikų skaičių operandai) ir 3DNow! instrukcijas (slankaus kablelio operandai) negaištant laiko persijungti tarp blokų. 3DNow! komandos naudoja tuos pačius registrus, kaip ir MMX, yra taip pat koduojamos ir gali būti vykdomos lygiagrečiai kartu su MMX komandomis.
3DNow! papildo ir padidina grafinių spartintuvų galimybes, pagreitindama veiksmus su slankaus kablelio operandais įvairiose grafinio konvejerio proceso stadijose.
Procesorius K6 – II yra pirmasis atitinkantis Socket7 standartus ir naudojantis 100 MHz magistralę.
Programinė įranga, kurios produktyvumas žymiai padidėja, naudojant 3DNow!:
Ø Trimatės grafikos žaidimai.
Ø Daugialypės terpės enciklopedijos;
Ø Tinklas ir tinklo stočių kūrimas;
Ø Prezentacijos, teksto procesoriai ir elektroninės lentelės;
Ø CAD/CAM priemonės;
Ø Trimačio garso apdorojimas;
Ø Balso atpažinimo įranga;
Ø Vaizdo perdavimas per Internet’ą;
Ø Kokybiškas DVD formato filmų skaitymas;
Ø Programinės trimačių valdiklių tvarkyklės;
Ø MPEG – video atkūrimas;
Ø Dolby AC – 3 (DVD filmuose naudojamas garso kodavimo formatas).
Kitas AMD kompanijos sukurtas procesorius buvo K6 – III, pasirodęs 1999 metų vasario mėnesį. Jis turėjo kristale integruotą antro lygio 256 KB dydžio priešatmintinę, bei galėjo dirbti su išorine trečio lygio preiešatmintine. Jo darbinis dažnis – 400, 450 MHz. Jo produktyvumas 15 – 20% didesnis nei K6 – II.
1999 metų viduryje pasirodė naujas kompanijos AMD procesorius – K7. Jis sudarytas iš 20 milijonų tranzistorių ir gaminamas pagal 0,25 µm technologiją, darbinis dažnis 500 MHz. Vėliau pasirodė procesoriai, pagaminti pagal 0,18 µm technologiją ir darbiniu dažniu iki 1GHz.
Procesorius patalpintas į kartidžą, kuris į pagrindinę plokštę jungiamas per SlotA jungtį, sukurtą kompanijos AMD.
5.2 pav. Procesoriaus K7 sandara
K7 ir SlotA naudoja magistralinį protokolą Digital Alpha EV6, kuris yra daug kuo pranašesnis už Intel P6 GTL+. EV6 ir numato galimybę naudoti topologiją point to point, kuri taikoma multiprocesorinėse sistemose (K7 palaiko multiprocesorines sistemas). Be to EV6 gali dirbti 200MHz ir didesniu dažniu. K7 buvo pirmasis procesorius, kuris leido pilnai išnaudoti greitaeigių RDRAM ir SDRAM operatyvinės atmintinės tipų galimybes. K7 turi 9 vykdomuosius blokus: tris sveikų skaičių apdorojimo blokus, tris adresų apdorojimui, ir tris daugialypės terpės blokus (vienas skirtas duomenų su slankiojančiu kableliu įrašymui/nuskaitymui (FStore) ir du konvejerinius blokus komandų (FPU/MMX/3DNow) vykdymui).
Procesorius AMD K7 gali dekoduoti tris x86 komandas į šešias RISC komandas. Po dekodavimo RISC86 komandos patenka į buferį, kur laukia, kol bus įvykdytos viename iš procesoriaus vykdymo blokų. K7 buferis gali saugoti 72 operacijas (tris kart daugiau, nei K6), išduoda po devynias - kiekvienam vykdymo blokui po vieną.
K7 turi 128 KB pirmo lygio priešatmintinę (64KB duomenims ir 64KB komandoms). Ryšiui su antro lygio priešatmintine yra speciali magistralė. K7 versijos skiriasi antro lygio priešatmintine – nuo2 iki 8MB.
K7 yra 7 – 10% produktyvesnis, nei to paties darbinio dažnio PentiumIII
Naujų mikroprocesorių AMD šeima įgijo pavadinimą Hammer. Pagrindinių plokščių gamintojai iš anksto pasiruošė ir jau pradėjo tiekti motinines plokštes su 754 ir 940 procesorių lizdais (jie skirti 64 bitų procesoriams.). Šiuo metu išleisti AMD procesoriai, priklausantys Hammer šeimai ir palaikantys 64 bitų instrukcijas - Athlon 64 3200+ (Clawhammeris – skirtas PC kompiuteriams) ir Athlon FX 51 (Sladgehammeris – skirtas serveriams). Šie procesoriai yra gaminami pagal 0,13 µm technologiją. Abu turi padidintą L2 vidinę atmintį - 1MB, FSB800 magistralę, atitinkamai 2GHz ir 2,2GHz dažnį, pirmasis skirtas 754 lizdui, antrasis - 940.
Clawhammeris skirtas "masėms", tuo tarpu gerokai galingesnis Sladgehammeris labai reikliems vartotojams, ypatingai sudėtingoms 3D instrukcijoms apdoroti (S754 palaiko vieno kanalo atminties pralaidumą, S940 - dviejų, pirmasis turi vieną Hypertransporto sąsają, antrasis - net 3). Mikroprocesorius turės tris jungtis su "HyperTransport" magistrale ir galės perduoti duomenis iki 19,2 Gb/s greičiu (tai beveik 6 kartus didesnis pralaidumas, nei turi dauguma šiuolaikinių serverių procesorių). Kainos taip pat atitinkamai skirsis - paprastiems vartotojams skirtas Clawhammeris turėtų būti gerokai pigesnis.
Savo technologiją AMD vadina x86-64: kompanija tiesiog pridėjo naujas 64 bitų instrukcijas prie įprastos x86 procesorių architektūros. Atstovo teigimu, 64 bitų "Hammer" architektūra nesuteikia asmeniniams kompiuteriams ypatingų pranašumų, tačiau yra "darbinio našumo pagerinimo mechanizmas". Procesoriai "Athlon 64" ir iš dalies "Opteron" turi greitaeigę sąsają su kompiuterio atmintine - "HyperTransport", kuri kilsteli darbinį našumą naudojant daug atminties reikalaujančias programas, ypač trijų dimensijų žaidimus.
Pagrindiniai x86-64 architektūros privalumai:
Ø Suderinamumas su x86 instrukcijomis;
Ø Bendros paskirties 64 bitų registrų versija;
Ø 8 nauji bendrieji registrai GPRs (General Purpose Registers);
Ø SSE ir SSE2 palaikymas, pridėti 8 nauji SSE2 registrai;
Ø Padidinta adresuojamos atmintinės erdvė;
Ø 64 bitų instrukcijų palaikymas.
Architektūrų skirtumai x86 ir x86 – 64 parodyti 5.3. pav.
5.3.pav. Architektūrų x86 ir x86 – 64 skirtumai
AMD64 architektūra praplečia egzistuojančią x86 architektūrą įvedus kelis kodo vykdymo režimus, priklausomai nuo poreikio užduoties vykdymui.
Kodo vykdymo režimai
Režimas “Long mode” realizuoja svarbiausią naujos technologijos privalumą. Jis turi du palaikymus:
64 skilčių režimą ir “suderinamumo rėžimą”. Režimas “Long mode” turi sekančias ypatybes:
Ø 64 skilčių virtuali adresų aplinka ir 52 – skilčių fiziškas adresų laukas (pirmosios AMD Opteron™ procesorių versijos bus leidžiamos su mažesnėmis reikšmėmis);
Ø “puslapinis” atmintinės valdymas;
Ø ribotas segmentacijos palaikymas;
Ø nepalaikomas mechanizmas x86 architektūros uždavinių perjungimui;
Ø pasenęs realus rėžimas ir režimas “Virtual-8086” nepalaikomas, palaikomas tiktai 64, 32 ir 16 bitų rėžimas;
Ø saugaus režimo palaikymas;
64-bitų režimas palaiko visas naujas procesoriaus galimybes:
Ø 64- skilčių virtuali adresacija;
Ø registrų plėtimas galimas naujojo prefikso (REX) pagalba:
o 8 naujų bendros paskirties registrų (R8 - R15);
o plėtimas visų bendros paskirties registrų iki 64 bitų;
o 8 naujų 128-bitų registrų SSE (XMM8 - XMM15);
Ø 64-bitų komandų interpretatorius (RIP);
Ø 64 skilčių komandų nuoroda RIP;
Ø “plokščias” adresų laukas, vieningas kodui, duomenims ir stekui.
Suderinamumo rėžimas leidžia 64- skilčių operacijų sistemoms išsaugoti pilną suderinamumą su egzistuojančiomis 16- ir 32- skilčių sistemomis, t.y. galimybę dirbti be perkompiliavimo į 64- skilčių sistemą. Suderinamumo rėžimas turi prieigą prie pirmųjų 4 GB virtualiosios atminties adresų. Suderinamumo rėžimas atrodo kaip saugus rėžimas x86. žiūrint iš operacijų sistemos pusės, adresų transliacija, pertraukymų valdymas o tai pat duomenų struktūros sistemą naudoja rėžimo “Long mode”. Mechanizmą.
Režimas “Legacy mode”. Rėžimo “Long mode” papildyme, architektūra palaiko “Legacy mode”, kuri palaiko pilną dvejetainį suderinamumą su egzistuojančiomis 16 ir 32 skilčių operacijų. sistemomis. Rėžimas“ Legacy mode” pilnai palaikomas su 32 skilčių realizacija x86 architektūroje.
Technologija AMD64 sukuria naujas galimybes programinio kodo optimizavimui programų kūrėjams.
Klasikinė architektūra x86 turi nedaug bendrosios paskirties registrų, kas stabdo sistemos paralelinius skaičiavimus. Dažnas duomenų keitimas tarp registrų stabdo sistemos našumą ir daro sudėtingesniu programinį kodą. AMD64 architektūra papildomai turi 8 naujus registrus ir leidžia panaudoti naujas skaičiavimo perspektyvas.
Pilnas aparatinis palaikymas klasikinės x86 komandų sistemos, leidžia eksploatuoti AMD64 sistemas nelaukiant 64 bit programinio versijos palaikymo. Nebūtina įsigyti naujos programinės įrangos kuria būtinas 64 bit palaikymas, tai sutaupo investicijas.
5.4 pav. Supaprastinta Hammer architektūra
Kurdami nauja architektūrą, AMD kompanijos specialistai stengėsi padidinti mikroprocesoriaus darbo našumą (ne tik didinant taktinį dažnį) . Tuo tikslu mikroprocesorių patobulino:
Ø padidinti konvejerių ilgiai: iki 12 pakopų fiksuoto kablelio skaičiams ir iki17 pakopų skaičiams su slankiu kableliu;
Ø įtaisytas atmintinės valdiklis;
Ø įtaisyta koherentinė sąsaja HyperTransport.
Ø
Vienprocesorinė ir daugiaprocesorinė konfigūracijos yra su antrojo lygmens priešatmintine, taip pat su „HyperTransport“ sąsaja. Vienprocesoriniai konfiguracijai priklauso mikroprocesorius Athlon ClawHammer – DT (DT reiškia DeskTop)..
Daugiaprocesorinei sistemai priklauso mikroprocesorius Opteron Sledge Hammer – MP (MP Multi Processing) su 72 – bitų kanalu DDR SDRAM DDR200/266/333 (PC1600/PC2100/PC2700), 16 – bitų sąsaja HyperTransport su 3,2 GB/s pralaidumu, antrojo lygmens 1MB spartinančiąja atmintine.
5.5 pav. Dviprocesorinio Hammer konfigūracija
Aštunta AMD procesorių karta paremta visiškai nauja AMD64 technologija, kuri praplečia tradicinę x86 architektūrą. Rezultate ne tik gaunamas didesnis sistemos našumas, bet ir išauga panaudojimo galimybės bei padidėja sistemos lankstumas.
Naujos architektūros galimybėmis pirmiausiai pasinaudos didesnės skaičiavimo spartos reikalaujantys ir naudojantys didelius duomenų masyvus serveriai, duomenų bazių valdymo sistemos, galingi skaičiavimo kompleksai.
Strateginis AMD perėjimo prie 64 bitų skaičiavimų sprendimas remiasi pilnu suderinamumu su jau egzistuojančiu 32 skilčių standartu operacinėms sistemoms ir tuo pačiu galimybe naudoti 64 skilčių skaičiavimus ten kur tai reikalinga.
AMD64 technologija vysto standartinę x86 architektūrą ir leidžia formuoti vieningą infrastruktūrą 64 skilčių technologijoje, kuri pilnai suderinama su tradicine standartine x86 architektūra. AMD64 technologija saugo klientų investicijas: jie toliau gali naudotis savo 32 skilčių programomis ir produktais, kol patys nuspręs diegti naują 64 bitų programinę įrangą.
Procesoriaus AMD Opteron™ mikroarchitektūra leidžia panaudoti unikalų lankstumą taikant naujas 64 skilčių operacijų sistemas ir programas, tuo pačiu palikdama pilną suderinamumą su jau egzistuojančiomis 32 bitų programinėmis priemonėmis.
Nauja architektūra operuoja 64 bitų adresų registrais ir duomenimis, o tai leidžia praplėsti operatyviosios atmintinės adresuojamąjį lauką ir atsikratyti egzistuojančio 4 GB apribojimo, kuris kelia sunkumus projektuojant informacijos apdorojimo sistemas.
Naujas patobulintas procesoriaus branduolys leidžia pakelti greitaveiką ir 64 skilčių ir 32 skilčių sistemoms.
AMD64 ir kitų 64 bitų architektūros procesorių palyginimas pateiktos lentelėje 5.1.
5.1 lentelė . 64-ių skilčių procesorių palyginimas
Architektūra AMD64
|
Kiti 64-bitų sprendimai
|
Pilnas suderinamumas su egzistuojančia x86 architektūra.
|
Instrukcijų rinkinys nesuderinamas su x86 architektūra.
|
Didelis našumas ir 32 bitų ir 64 bitų rėžime
|
Žemas našumas 32 bitų režime. Visi tobulinimai orientuoti į 64 bitų režimo greitaveiką.
|
Įgalina sklandžiai pereiti prie naujos architektūros, jei tai reikalinga.
|
Reikalauja pereiti prie 64 bitų skaičiavimo, net jeigu tai nebūtina.
|
Leidžia išsaugoti investicijas egzistuojančioje 32 bitų programinėje įrangoje.
|
Reikalauja naujų investicijų: 2 instrukcijų rinkiniams, 2 operacinėms sistemoms, 2 rinkiniams taikomojo palaikymo sistemų.
|
Pilnas palaikymas 16 , 32 ir 64-skilčių formatų vienu metu.
|
16 ir 32 skilčių palaikymas tiktai programinės ar aparatinės emuliacijos režimu.
|
32-bitų kodas dirba be pakitimų. Gali dirbti senais būdais, naudojant 64-skilčių adresaciją.
|
Reikalauja 32- skilčių kodo keitimo, norint gauti maksimalų našumą.
|
Technologija HyperTransport™ – tai dar viena naujos AMD technologijos sudedamoji dalis. Tai efektyvi ir greita taškas – taškas tipo sąsaja, skirta ryšiams su lustais ir suprojektuota didelio duomenų srauto praeinamumui būsimoms komutacinėms ir skaičiavimų platformoms. Ji palaiko pikinį našumo barjerą iki 12.8 GB / s. Technologija HyperTransport™ siūlo idealius sprendimus daugeliui didelio pralaidumo reikalaujančių programų. HyperTransport™ panaudojimas pakelia sistemos našumą, panaikindama “siauras “ vietas duomenų sraute, praplėsdama duomenų srautą ir mažindama kreipties vėlinimą.
Pagrindinės technologijos HyperTransport™ techninės charakteristikos pateiktos lentelėje:
5.2 lentelė. Pagrindinės technologijos HyperTransport™ techninės charakteristikos
Sąsajos tipas
|
„Taškas-taškas“
|
Plotis
|
2, 4, 8,16 arba 32 bitai
|
Protokolas
|
Paketinis duomenų perdavimas (daugelio keturių baitų paketų pluoštais)
|
Pralaidumo juosta (abiem kryptimis)
|
Nuo 100 iki 6500 МB/s
|
Pikinis našumas
|
Iki 12,GB/s
|
Signalai
|
1,2 V – žemos įtampos diferencialiniai signalai (LVDS) 100 omų
|
Daugiaprocesoriškumo palaikymas
|
Taip
|
Atmintinės modelis
|
Koherentinė ir nekoherentinė
|
Pagrindinės HyperTransport™ technologijos ypatybės:
Ø Gali apjungti iki 32 įrenginių;
Ø Reikalauja nedidelio skaičiaus signalinių laidininkų, kas labai supaprastina sistemos projektavimą;
Ø Mažos srovės diferencialinių signalų panaudojimas padeda išspręsti kryžminių trukdžių ir elektromagnetinio suderinamumo problemas;
Ø Palaiko PCI gyvybinį ciklą, leidžiant pilnai suderinti su PCI programinių modelių palaikymu, operacinių sistemų tvarkyklėmis.
Ø Mažos srovės diferencialinių signalų panaudojimas padeda sistemų kūrėjams naudoti energijos taupymo technologijas ir projektuoti paprastas ir pigias plokštes;
Ø Palaiko platų signalinį diapazoną, tai leidžia sistemas lengvai papildyti naujomis aukšto produktyvumo dalimis;
Ø Trumpina projektavimo laiką, diegiant naujus elementus, nes nereikia pilnai perprojektuoti sistemos
Pagrindinis tikslas kurio buvo siekiama projektuojant naują procesorių AMD Opteron™ - užtikrinti naują našumo lygį vartotojams. Norint tai pasiekti, įvestas optimalus balansas tarp darbo dydžio atliekamo per vieną procesoriaus darbo taktą ir galimybės kelti taktinį dažnį vystant technologinį procesą. Naudojamas pakeistas konvejeris, kuris turi 12 pakopų sveikiems skaičiams apdoroti ir 17 pakopų slankaus kablelio skaičiams. Procesoriaus branduolio mikroarchitektūra parodyta paveikslėlyje 5.6.
5.6 pav. Procesoriaus branduolio mikroarchitektūra
Eilė architektūrinių pakeitimų buvo padaryta siekiant padidinti atliekamų instrukcijų skaičių per vieną taktą lyginant su praeitos kartos procesoriais. Remiantis novatoriškom technologijom AMD Opteron™ procesorius rodo žymiai geresnius rezultatus ir produktyvumą tuo pačiu taktiniu dažniu, palyginus su praeitos kartos procesoriais.
AMD Opteron™ procesorius gaminamas pačiomis naujausiomis technologijomis, naudojant SOI (Silicon on Insulator) technologiją, kuri įgalina kelti procesoriaus taktinį dažnį ir produktyvumą. Ateityje planuojama šio procesoriaus gamyboje panaudoti technologines normas, kurios leis prieiti prie 0.10 mikronų technologijos.
Šiaurės tiltas AMD dviejų branduolių procesoriuose integruotas į procesoriaus lustą. Privalumas yra tas, kad dvejų branduolių procesorius galima pajungti per standartinį lustyną, skirtą paprastam K8 architektūros vieno branduolio procesoriui. Kompiuterio architektūra yra NUMA. Tokios architektūros dėka procesorius gali kreiptis į kito procesoriaus atmintinę. Kad procesoriai netrukdytų vienas kitam, kreipdamiesi į tą patį atmintinės segmentą, buvo sukurtas komutatorius “Cross bar”. Jis atsakingas ir už automatinį duomenų, kurie įvedami iš išorinių įrenginių, paskirstymą. Šiaurės tilto integravimas ir “AMD” “Hiper transport” technologijos naudojimas leidžia dirbti dviem branduoliams praktiškai netrukdant vienas kitam.
5.7. pav. Klasikinė AMD dvejų branduolių procesoriaus sandara
5.8 pav. Opteron procesorius ir jo jungimas daugiaprocesorinėje sistemoje
Be procesoriaus branduolio kristale integruotas atmintinės valdiklis, pirmo ir antro laipsnio priešatmintinė ir HyperTransport™ magistralės valdiklis. Toks sprendimas pirmą kartą naudojamas procesorių industrijoje ir atveria naujas galimybes projektuojant aukšto našumo platformas.
Efektyviam srautų paskirstymui tarp trijų HyperTransport™ sąsajų, atminties valdiklio ir vidinių sisteminių sąsajų, naudojamas vidinis procesoriaus komutatorius XBAR, kuris parodytas paveikslėlyje 5.7.
AMD Athlon 64 FX-51 procesorius specialiai skirtas vartotojams, kuriems reikia maksimalaus našumo, žaidimų mėgėjams, “greitos sistemos” entuziastams.
5.9 pav. Sempron procesorius
AMD Sempron™ skirti vidutinės klasės staliniams ir nešiojamiems kompiuteriams. Procesorius gaminamas pagal AMD64 ir HyperTransport™ technologiją.
Jis turi iki 256KB priešatmintinės, iki 1600MHz dvipusio veikimo sisteminę magistralę, ir integruotą DDR atminties valdiklį. Integruota “Enhanced Virus Protection” apsauga nuo virusų, kuri veikia su Microsoft® Windows® XP SP2, Linux, Solaris ir BSD Unix, kartu su antivirusinėm programom sudaro bendrą apsaugą nuo kenkėjiškų programų.
Enchanced Virus Protection (EVP): technologija skirta apriboti kenkėjiškų programų plitimui. Ji daliai sisteminės atminties uždraudžia vykdomąsias funkcijas, palikdama tik įrašymo ir nuskaitymo funkcijas.
Pagrindinės charakteristikos:
Ø AMD64 branduolys užtikriną spartų darbą tiek su 32-bitų, tiek su 64-bitų programomis
Ø AMD64 technologija užtikrina pilną x86 kodo palaikymą;
Ø 40-bitų fiziniai adresai, 48-bitų virtualūs adresai;
Ø Šešiolika 64-bitų sveikojo skaičiaus registrų;
Ø Šešiolika 128-bitų SSE/SSE2/SSE3 registrų;
Ø AMD Digital Media XPress™ palaiko SSE, SSE2, SSE3 ir MMX instrukcijas;
Ø Integruotas spartus didelio pralaidumo DDR atminties valdiklis;
Atminties magistrales pralaidumas iki 3.2GB/s (socket 754) arba 10.6GB/s (socket AM2).
Didelio pralaidumo ryšys su I/O įrenginiais naudojant HyperTransport™ technologiją (iki 6,4 Gb/s).
Didelio našumo integruotos spartinančios atmintys luste:
Ø L1 instrukcijų spartinančioji atmintis 64KB;
Ø L1 duomenų spartinačioji atmintis 64KB;
Ø L2 spartinančioji atmintis iki 256KB.
Sempron serijos procesoriaus ir lustyno ryšio sistema parodyta pav.5.10.
5.10 pav. Sempron serijos procesoriaus ir lustyno ryšio sistema
Architektūra liko nepakitusi nuo Sempron serijos procesorių, pagrindinis skirtumas yra padidinta L2 spartinančioji atmintis iki 1MB (939 lizdui) arba 512KB (AM2 lizdui). Yra didesnio pralaidumo sisteminė sąsaja - iki 14.34Gb/s (939 lizdas) ir 18.6Gb/s (AM2 lizdas).
5.11 pav. Athlon 64 procesorius
Pagrindinis skirtumas nuo anksčiau paminėtų procesorių - tai dual core technologija patalpinanti du branduolius tame pačiame luste. Tai leidžia atlikti visus skaičiavimus dviem srautais, atlikdami, tarkime, vaizdo failo konvertavimą (kuris naudoja nemažai procesoriaus resursų) antrame plane, galime vykdyti kitas programas pirmajame plane. Programos, kurios naudojamos pastoviai įjungus kompiuterį (antivirusinės, ugniasienės ir t.t.), dabar neatima procesoriaus resursų iš programų, su kuriomis dirbama, nes gali veikti antrajame plane. Tai padidina efektyvumą ir spartumą dirbant kelioms ar daugiagijėms programoms. Darbas su ofisinėm programomis paspartėja iki 22%. Vienas iš privalumų - tai jog dual core procesoriui tinka tos pačios pagrindinės plokštės, tik reikalingas BIOS atnaujinimas.
5.12 pav. AMD Atlhlon 64 Dual-core procesorius
Pagrindiniai pokyčiai:
Ø Spartesnė atminties magistralė: iki12.8GB/s (AM2 lizdas);
Ø Didesnio pralaidumo sisteminis interfeisas: iki 20.8GB/s (AM2 lizdas);
Ø Cool'n'Quiet™ technologija tyliam veikimui ir mažesnėms energijos sąnaudoms.
Cool'n'Quiet™: ši sistema 30 kartų per sekundę stebi procesoriaus resursų panaudojimą ir kai resursai yra neišnaudojami (pvz.: dirbama teksto redaktoriumi) sklandžiai sumažina procesoriau dažnį, bei voltažą. Padidėjus resursų panaudojimui, dažnis bei voltažas didinami. Tokiu būdu, dirbant su programomis, reikalaujančiomis mažai sistemos resursų, yra sumažinama sistemos sparta ir tuo pačiu sutaupoma energija bei sumažinamas šilumos atidavimas (lėtesnės aušintuvo apsukos, mažesnis triukšmo lygis).
Šie procesoriai skirti serveriams bei darbo stotims.
AMD Opteron™ procesorių karta turi šiuos patobulinimus: galimybė naudoti 4 branduolių sistemą, AMD Virtualization™ (AMD-V).
Panaudota “Direct Connect Architecture” architektūra, jungianti atminties bei Į/I valdiklius tiesiai prie procesoriaus (komunikacija vyksta procesoriaus dažniu).
Trys lygiagrečios Hyper Transport sąsajos palaiko iki 24GB/s maksimalų pralaidumą kiekvienam procesoriui. Integruotas DDR2 atminties valdiklis leidžia pasiekti iki 10.7GB/s pralaidumą atskiriems procesoriams.
AMD Virtualization™ (AMD-V™):
Aparatūriškai palaikoma AMD Virtualization™ ir Direct Connect Architektūra leidžia serveryje naudoti daugiau virtualių mašinų, nutolusių darbo vietų.
Enhanced Performance-per-Watt:
Taupi DDR2 atmintis suvartoja iki 30% mažiau energijos nei DDR1 ir iki 58% mažiau nei FBDIMM.
AMD PowerNow!™:
Technologija su optimizuotu energijos valdymu, priklausomai nuo apkrovos, sumažina energijos sąnaudas.
Standartinės magistalės dirba su sumažinto voltažo signalais, todėl mažiau trigdžių ir mažiau suvartojama elektros energijos.
5.13 pav. Keturių branduolių Opteron sistema
Gaminio kūrimo pagal užsakovo reikalavimus tendencija jau gyvuoja žemesnėse mikroprocesorių pramonės nišose. Lustų pagrindu kuriami gaminiai yra modulinės struktūros; jie projektuojami iš atskirų nekintamų blokų, atliekančių tam tikras funkcijas (šie blokai dar vadinami intelektinės nuosavybės blokais - intelectual property blocks, toliau - IP).
Esami IP gaminiai firmas skatina daugiau sutelkti dėmesį į sistemų kūrimą iš gatavų blokų, o ne kaskart projektuoti naujus gaminius. Norint sukurti originalų specialios paskirties gaminį ar jo komponentą, tereikia išsirinkti reikiamus procesorius ar kitokio tipo branduolius ir juos sujungti į visumą.
Neseniai kelios kompanijos šią blokų išrankos ir jų integracijos metodiką ėmė plėtoti toliau - pradėjo kurti specializuotų mikroprocesorių branduolius. Naudodami specialias projektavimo priemones, inžinieriai tokį mikroprocesorių gali suprojektuoti labai greitai - per kelias savaites.
Pagrindinės šioje specializuotų branduolių kūrimo veikloje dalyvaujančios kompanijos yra Tensilica, ARC Cores, Hewlett Packard ir STMicroelectronics. Jų veiklos "ideologija" panaši, bet skirtingi uždaviniai ir rinka. Pavyzdžiui, kompanija Tensilica, gaminanti "Xtensa" serijos specializuotus procesorius, išsiverčia su paprastais mikroprocesoriniais branduoliais. O vartotojas šiai įmonei gali ir pats apibrėžti savo keliamus reikalavimus atitinkamame tinklalapyje, vartodamas aukštojo lygmens kalbą, pvz., "Verilog".
ARC Core kompanijos "ARCtangent" serijos gaminiai taikosi į skaitmeninių signalų procesorių rinką. Kaip ir Tensilica, ji užsakovams leidžia patiems apibrėžti norimo procesoriaus savybes - linijų grupės plotį, operatyviosios buferinės atminties talpą ir t.t. Hewlett Packard kompanijos HP/ST Lx gaminių serijos paskirtis - spartinti daugialypės informacijos (garso, vaizdo) apdorojimą taikant labai ilgų žodžių komandų metodiką. Vartotojui leidžiama pasirinkti lygiagrečių komandų rinkinį - pasirenkamas reikiamas skaičius įrenginių, kuriais vienu metu atliekamos kelios operacijos.
AMD K10
K10 architektūra yra vystoma jau nuo 2007 metų, todėl iš esmės yra gana pasenusi. Kaip tyčia ant nosies yra revoliucinių „Bulldozer“ procesorių pasirodymas, bet duomenų apie juos vis dar nėra daug. Vis dėlto pačią architektūrą pasistengsiu apžvelgti kiek įmanoma plačiau, nes jau rytoj būtent ši AMD architektūra bus aktuali namų vartotojams, kai tuo tarpu K10 jau bus pamiršta.
K10 turi pirmtakę apie kurią nebuvo daug šnekėta. Kaip paaiškės vėliau iš mano aprašymo, pati K10 nėra jau tokia revoliucinė, kaip buvo skelbta. Detaliau sulyginus šias architektūras ir jų veikimo principus pasidaro aišku, kad tai tik patobulinta K8, kuri savyje kažko kardinaliai pakeisto neneša. Per daug nesigilindamas į K10 pradėsiu apžvalgą nuo šios architektūros neženkliai patobulintos versijos, kuri buvo pristatyta 2009 metais ir gavo pavadinimą K10.5. Beje, visa kompiuterio platforma komplektuojama su 4xxx serijos „Radeon“ vaizdo plokštėm ir šios architektūros procesoriais gavo pavadinimą „Dragon“. Esminis K10 ir K10.5 skirtumas yra pagaminimo technologija (tech. procesas), K10 buvo gaminamas pagal 65nm, tuo tarpu K10.5 jau naudojos 45nm gaminimo technologijos privalumais.
pav. Pirmojo K10 architektūros procesoriaus palyginimas su ankstesniais AMD procesoriais. (paimta iš tomshardware.com)
pav. Dviejų branduolių K8 architektūros ir keturių branduolių K10 architektūros procesorių palyginimas (paimta iš ixbt.com)
Kaip matome paveikslėlyje, kartu su nauja architektūra esminiai nauji komponentai buvo trečiojo lygmens spartinančioji atmintis ir patobulinta sistemos magistralė „Hyper-Transport 3.0“. Tačiau buvo ir daugiau patobulinimų, apie kuriuos ir papasakosiu žemiau pateiktoje medžiagoje.
Galima pamatyti, kad nors tranzistorių gaminimo technologija sumažėjo, vis dėlto dėl papildomų dviejų branduolių AMD inžinieriams teko paaukoti daugiau vietos. Lustas tapo didesnis nors ir visi branduoliai buvo apjungti į vieną.
pav. 128 bitų pralaidumo atminties valdiklis prieš 64 bitų pralaidumo valdiklį (paimta iš amd.com)
Viena iš didesnių K10 naujovių – naujas atminties valdiklis. K8 architektūroje buvo naudojamas vienas 128 bitų atminties valdiklis, kurį galima buvo traktuoti kaip du apjungtus 64 bitų valdiklius. Kaip matome 2.9 paveikslėlyje, K10 architektūroje yra realizuoti du nepriklausomi 64 bitų valdikliai, kurie leidžia ženkliai sumažint kreipties laiką į atmintį. 64 bitų atskiri valdikliai yra efektyvesni už vieną 128 bitų būtent dėl to, kad šiuo metu naudojama atmintis yra 64 bitų. . Taigi, kai K8 architektūros procesoriui reikia nuskaityti duomenis tik iš vieno atminties bloko, jis to padaryti negali, tenka nuskaitinėt iš dviejų, taip didinant vėlinimą. Tokiu būdu iš K10 atminties valdiklio išgaunamas dvigubas pralaidumas, nes jis gali nuskaitinėti duomenis nepriklausomai.
K10 architektūra nesugebėjo parodyti jokių ypatingų rezultatų. Be to pirmieji egzemplioriai, kurie turėjo kodinius branduolių pavadinimus „Agena“ ir „Barcelona“ be viso to pagarsėjo dar ir taip vadinama TLB (Transliacijos asociacinis buferis) klaida. Ši klaida sutinkama visuose keturių branduolių B2 revizijos AMD procesoriuose ir gali išvesti sistemą iš rikiuotės stipriai ją apkraunant. Ypač didelę problemą klaida keldavo serverių segmente, kur sistemos nesklandumai skaudžiai atsiliepdavo jų savininkui. Vėliau buvo išleistas papildinys, kuris atjungdavo dalį loginių procesoriaus blokų, taip priversdamas jį dirbt stabiliai, tačiau labai sumažindamas bendrą našumą. Klaida buvo ištaisyta B3 revizijoje.
pav. Esminiai K10 technologiniai pranašumai prieš K8 (paimta iš amd.com)
· Didesnis tranzistorių skaičius ir naujoji trečiojo lygmens spartinančioji atmintis, kuri apjungia procesorius.
· SSE instrukcijų blokų pralaidumas padidintas nuo 64 bitų iki 128 bitų.
· Pralaidumas tarp antrojo lygio spartinančiosios atminties ir atminties valdiklio taip pat padidintas iki 128 bitų
· Pagerinta išsišakojimų nuspėjimo technologija.
K10 architektūra daug geriau nuspėja perėjimus ir atsišakojimus. Dėka šito pagerėja nuspėjimų tikslumas, o kuo tikslesnis perėjimų nuspėjimas, tuo efektyviau procesorius gali užkrauti savo vykdomuosius blokus.
Taip pat dvigubai padidintas gražinimo steko dydis. K8 architektūrai, vykdant ilgą užklausų grandinę, galima situacija, kai naujojo pradinio adreso įrašymui į steką neužtenka vietos. Tokiu būdu išsišakojimų nuspėjimas darosi neįmanomas. Dėka šio patobulinimo, tokio persipildymo galimybė ženkliai sumažinta.
· Beeilė komandų užkrovimo technologija.
K8 ir „NetBurst“ architektūros procesoriai iškrauna apdorotus duomenis tik po to kai gauna naujus ir tai sulėtina našumą, nes dalis vykdomųjų procesoriaus blokų stovi „be darbo“. Savo ruožtu K10 turi galimybę naujus duomenis įkrauti dar neiškrovus senų.
pav. Supaprastinta K10 ir K8 architektūrų branduolio sandaros schema (paimta iš wikipedia.com)
pav. Procesoriaus AMD „Phenom II X6 1100T Black Edition“ sandaros chema. (paimta iš amd.com)
Šis procesorius turi šešis branduolius, kurie turi atskirą antrojo lygio ir bendrą trečiojo lygio spartinančiąją atmintį. Nors pavaizduota tik DDR2, tačiau procesorius turi ir DDR3 atminties kontrolerį. „Crossbar“ tipo sujungimas (kai į matricą turinčią daug išėjimų ir įėjimų sujungiami reikalingi įrenginiai) ir „HyperTransport“ magistralė.
lentelė. Phenom II šešių branduolių procesorių charakteristikų lentelė
2.3 lentelė. Phenom II keturių branduolių procesorių charakteristikų lentelė
lentelė. Athlon II keturių branduolių procesorių charakteristikų lentelė
2.5 lentelė. Vieno branduolio Sempron procesorių charakteristikų lentelė
Model number – procesoriaus modelis.
Step.(stepping) – revizija, procesoriaus versija.
Freq.– darbo dažnis.
Turbo – dažnis naudojant technologiją „Turbo Core“.
L2 cache – antrojo lygmens spartinančioji atmintis.
L3 cache – trečiojo lygmens spartinančioji atmintis.
HT – Hyper transport magistralės darbo dažnis.
Multi. – procesoriaus dažnio daugiklis.
Voltage – procesoriaus darbo įtampa.
TDP – išskiriamos šilumos kiekis vatais.
Socket – lizdo tipas.
Release date – pasirodymo data.
AMD bulldozer
Naujoji dar neišleista, bet jau pristatyta AMD kompanijos architektūra. Ši architektūra bus gaminama pagal 32nm technologinį procesą, o pirmieji viešajai rinkai skirti egzemplioriai bus prieinami jau netrukus.
Pasak AMD atstovų ši architektūra bus visiškai išsiskirianti nuo prieš tai buvusių K10 ir K8 (nors tą patį galima buvo girdėti ir prieš K10 pasirodymą). Pirmą kartą AMD realizuos Intel „Hyper-threading“ technologijos analogą. Taip pat „Bulldozer“ palaikys visiškai naujų instrukcijų rinkinį (SSE 4.1, SSE 4.2, CVT16, AVX ir XOP). Dar vienas nuo Intel nukopijuotas žingsnis – vaizdo branduolio integracija į procesoriaus lustą. Namų rinkai skirti „Bulldozer“ architektūros procesoriai palaikys iki 8 branduolių, tuo tarpu serverių segmentui bus siūlomi iki 16 branduolių turintys procesoriai.
pav. Lygiagretus daugiasrautis apdorojimas, blokinė schema, privalumai. (paimta iš amd.com)
Taigi, pasak AMD atstovų jų „Hyper-threading“ analogas bus kur kas sėkmingesnis (to ir reiktų tikėtis, nes Intel technologijai jau bemaž 9 metai). Technologijos esmė tame, kad kiekvienas sveikųjų skaičių išskaičiavimo blokas galės dirbti su savo srautu. Būtent tą ir matome pavaizduota 2.13 paveikslėlyje.
pav. Lygiagretus daugiasrautis apdorojimas vieno branduolio kristale palyginimas su dviejų branduolių apdorojimu. (paimta iš amd.com)
Iš dalies pateisinantis pačią architektūrą pavadinimas – „Bulldozer“. Tikėtina, kad šie procesoriai galės dirbti žemesniais dažniais lyginant su konkurentais, kai tuo tarpu našumas bus daug geresnis. Skritingi „Bulldozer“ lusto komponentai galės formuoti modulius, kurių kiekvienas iš esmės galės virsti visaverčiais dviem branduoliais. Tokiu būdu AMD gali sukurti 8 branduolių procesorių, panaudodama mažesnį lusto plotą ir tranzistorių kiekį palyginus (jei būtų toks procesorius) su K10 architektūra. Be visą ko, operacinė sistema matys tikrus 8 loginius procesorius, o tam kad paskirstyt duomenų srautą procesorių viduje (kaip ta daro HT), nereikės papildomų tvarkiklių, nes tuo pasirūpins pati procesoriaus architektūra. Viskas atrodytų gražu, tačiau tikėtina, kad gausim apgaulingą kiekį branduolių turinčius procesorius. Viską paaiškina marketingas. Juolab, jeigu gausim realią aštuonių branduolių spartą, niekam ir nekils noro skųstis tokia “apgaulinga“ sparta.
pav. Lygiagretus daugiasrautis apdorojimas dviejų branduolių kristale. (paimta iš amd.com)
Pačios AMD kompanijos teigimu, toks vidaus įrenginys bus vadinamas moduliu. Iš esmės, kaip galima pamatyt 2.15 paveikslėlyje modulis turi savyje du apdorojančius branduolius ir bendrą padedančiųjų blokų sistemą.
AMD ne tik įvedė revoliucinį „Hyper-threading“ analogą į savo sistemą, bet ir sugebėjo perimti stipriąsias konkurentų procesorių savybes: bendroji antrojo lygmens spartinančioji atmintis ir padidintas dekoderio kanalų skaičius, jų dabar keturi. Toks dekoderio kanalų skaičius leis per vieną taktą dekoduoti iki 4 instrukcijų (naudojant makrosusiliejimą, kai tipinės instrukcijų poros yra apjungiamos į vieną iki aštuonių). Tuo tarpu K10 gali įvykdyti iki trijų (naudojant makrosusiliejimą iki šešių) instrukcijų, o „Nehalem“ architektūros procesoriai iki keturių (naudojant makrosusiliejimą iki penkių) instrukcijų. Toks sprendimas leis geriau apkrauti išskaičiavimo modulius, kas turėtų gerai atsiliepti bendrajam našumui.
Pirmas įspūdis kurį sudaro „Bulldozer“ architektūra yra labai teigiamas, tačiau kol kas viskas yra tik “ant popierio“ ir aklai pasikliauti AMD reklamuojama architektūra nereikėtų. Juolab, netrukus turėtų pasirodyti procesoriai kodiniu pavadinimu „Zambezi“, kurie ir galės apginti AMD pozicijas realioje situacijoje.
Kaip matome iš 2.3, 2.4, 2.5 lentelių AMD siūlomų procesorių gama yra kiek didesnė nei Intel kompanijos. Kol kas AMD užbaiginėja savo senai naudojamos K10.5 architektūros erą. Kad architektūra buvo nevykusi sakyti negalima, tačiau reikėtų pastebėti, kad kompanija kiek uždelsė su naujovėm. K10 tebuvo patobulinta K8 ir radikalių pasikeitimų į procesorių našumą įnešt negalėjo. Nepaisant keleto naujų modulių, tokių kaip - planuotojas, naujas atminties valdiklis ar šakų nuspėjimo mechanizmas, K10 architektūra nieko naujo neatnešė, nes pats operacijų vykdymo mechanizmas išliko tas pats. To ko nepadarė K10, turėtų padaryti naujoji „Bulldozer“ architektūra. Jau dabar aišku, kad mūsų laukia revoliuciniai sprendimai, kurie teoriškai yra pažangesni ne tik už senus K10 architektūros sprendimus, bet ir už naujosios Intel „Sandy Bridge“ architektūros novatoriškumus. Deja, „Bulldozer“ procesoriai dar nėra išleisti, todėl realiai vertinti situaciją šių procesorių atžvilgiu kol kas yra neįmanoma.
K5
1. Kaip procesoriuje realizuotas x86 komandų dekoderis?
2. Ar kad įgyvendinti dinaminį duomenų apdorojimą, naudojami: dinaminis registrų pervadinimas, nukreipimų spėjimas, vykdymo eiliškumo keitimo metodai?
3. Kiek operacijų su sveikais skaičiais gali lygiagrečiai vykdyti K5?
4. Kiek lygiagrečiai dirbančių blokų yra K5 procesoriuje?
5. Ar K5 gali keisti atliekamų operacijų eiliškumą?
K6 (I-II)
1. Kokioms technologijoms vystyti šiame procesoriuje skirtas pagrindinis dėmesys?
2. Apibūdinkite 3D NOW ir MMX komandų skirtumus.
K7
1. Kam skirti K7 vykdomieji blokai?
2. Kiek komandų gali dekoduoti K7?
Hammer
1. Kam skirti nauji 8 nauji bendros paskirties registrai (general purpose registers, GPRs)?
2. Iki kiek padidinta adresuojamos atmintinės erdvė?
3. Ką duoda 64 bitų instrukcijų palaikymas?
4. Kaip realizuota 64- skilčių virtuali adresacija?
5. Kaip gali būti išplėsti registrai?
6. Kas tai yra HyperTransport magistralė?
7. Kokios pagrindinės HyperTransport magistralės savybės?
8. Kas būdinga dviejų ir keturių branduolių procesorių architektūroms?
1. Su mikroprocesorių šeima Pentium pasaulinėje rinkoje sėkmingai konkuruoja kompanijos AMD sukurti Krypton (K-5, K-6, K-7, Athlon) bei naujieji Hammer šeimos procesoriai, turintys x86 komandų sistemą.
2. Ne vienerius metus kompanija AMD mikroprocesorių gamybos srityje atsilikinėjo nuo Intel’io visa mikroprocesorių karta ir tenkindavosi tik tuo, kad procesorius gamindavo naudodama licenzijuotas technologijas, tik įdiegdama keletą savo konstrukcinių patobulinimų.
3. Atsiradus mikroprocesoriui Pentium, matydami pavojų būti visiškai išstumtiems iš mikroprocesorių rinkos, AMD ėmėsi kurti visiškai naują mikroprocesorių šeimą suderinamą su x86 mikroprocesorių šeima.
4. K5 - tai pirmasis AMD procesorius, sukurtas nesinaudojant jokia Intel turima informacija (išskyrus mikrokodą x86), ir pirmasis, siūlantis didesnį produktyvumą, nei Intel procesoriai. Kaip teigia AMD, tokios programos, kaip Microsoft Excel, Microsof Word ar Corel Draw su mikroprocesoriumi K5 dirba 30% sparčiau, negu su tokio pat taktinio dažnio Pentium.
5. Toks K5 produktyvumas pasiektas dėl padidintos priešatmintinės ir progresyvesnės superskalirinės architektūros. Vietoje Pentium naudojamų sudvejintų konvejerių sveikų skaičių apdorojimui, K5 mikroprocesoriuje naudojama superskaliarinė architektūra su keturgubu komandų pateikimu, penkiais apdorojimo blokais ir RISC branduoliu su unikaliu x86 komandų dekoderiu.
6. 1998 metų gegužės pabaigoje AMD pranešė apie savo naują produktą – mikroprocesorių K6 – II su superskaliariniu MMX komandų apdorojimu ir 3DNow! technologija, kurioje yra 21 nauja instrukcija, tarp kurių - pagreitinančios trimačių objektų vaizdavimą, palaikančios stereo garsą bei video. Tokios galimybės Intel mikroprocesoriuose buvo įgyvendintos žymiai vėliau, kai buvo išleistas procesorius Pentium III.
7. Pagreitintas apdorojimas, naudojant 3DNow! technologiją, gaunamas dėl to, kad vietoje MMX komandų yra naudojamos analogiškos, bet dirbančios su slankaus kablelio formato duomenimis SIMD komandos.
8. 1999 metų viduryje pasirodė naujas kompanijos AMD procesorius – K7. Jis sudarytas iš 20 milijonų tranzistorių ir gaminamas pagal 0,25 µm technologiją, darbinis dažnis 500 MHz.
9. Procesorius AMD K7 gali dekoduoti tris x86 komandas į šešias RISC komandas. Po dekodavimo RISC86 komandos patenka į buferį, kur laukia, kol bus įvykdytos viename iš procesoriaus vykdymo blokų. K7 buferis gali saugoti 72 operacijas (tris kart daugiau, nei K6) ir išduoda po devynias - kiekvienam vykdymo blokui po vieną.
10. Naujų mikroprocesorių AMD šeima įgijo pavadinimą Hammer. Pagrindinių plokščių gamintojai iš anksto pasiruošė ir jau pradėjo tiekti motinines plokštes su 754 ir 940 procesorių lizdais (jie skirti 64 bitų procesoriams.).
11. Aštunta AMD procesorių karta paremta visiškai nauja AMD64 technologija, kuri praplečia tradicinę x86 architektūrą. Rezultate ne tik gaunamas didesnis sistemos našumas, bet ir prasiplečia panaudojimo galimybės bei padidėja sistemos lankstumas.
12. Strateginis perėjimas prie 64 bitų skaičiavimo remiasi pilnu suderinamumu su jau egzistuojančiu 32 skilčių standartu operacinėms sistemoms ir tuo pačiu galimybe naudoti 64 skilčių skaičiavimus ten, kur tai reikalinga.
13. AMD64 technologija vysto standartinė x86 architektūrą ir leidžia formuoti vieningą infrastruktūrą 64 skilčių technologijoje, kuri pilnai suderinama su tradicine standartine x86 architektūra. AMD64 technologija saugo klientų investicijas: jie toliau gali naudotis savo 32 skilčių programomis ir produktais, kol patys nuspręs diegti naują 64 bitų programinę įrangą.
14. Procesoriaus AMD Opteron™ mikroarchitektūra leidžia panaudoti unikalų lankstumą naudojant naujas 64 skilčių operacijų sistemas ir programas tuo pačiu palikdama pilną suderinamumą su jau egzistuojančiomis 32 bitų programinėmis priemonėmis.
15. Nauja architektūra operuoja 64 bitų adresų registrais ir duomenimis, o tai leidžia praplėsti operatyviosios atmintinės adresuojamąjį lauką ir atsikratyti egzistuojančio 4 GB apribojimo, kuris kelia sunkumus projektuojant informacijos apdorojimo sistemas.
16. Technologija HyperTransport™ – tai dar viena naujos AMD technologijos sudedamoji dalis. Tai efektyvi ir greita taškas – taškas tipo sąsaja, skirta ryšiams su lustais ir suprojektuota didelių duomenų srautų siuntimui būsimoms komutacinėms ir skaičiavimų platformoms.
17. Technologija HyperTransport™ palaiko pikinį našumo barjerą iki 12.8 GB/s. Technologija HyperTransport™ siūlo idealius sprendimus daugeliui didelio pralaidumo reikalaujančių programų. HyperTransport™ panaudojimas pakelia sistemos našumą, panaikindama “siauras “ vietas duomenų sraute, praplėsdama duomenų srautą ir mažindama kreipties vėlinimą.
18. AMD Sempron™ skirti vidutinės klasės staliniams ir nešiojamiems kompiuteriams.
19. Pagrindinis dual core procesorių skirtumas nuo ankčiau nagrinėtų - tai technologija patalpinanti du branduolius tame pačiame luste. Visus skaičiavimus tuomet galima vykdyti dviem srautais. Atlikdami, tarkime, video failo konvertavimą (kuris naudoja nemažai procesoriaus resursų) antrame plane, galime vykdyti kitas programas pirmajame plane.
20. Pagrindinis tikslas kurio buvo siekiama naujo procesoriaus AMD Opteron™ - užtikrinti naują našumo lygį vartotojams. Norint tą pasiekti, įvestas optimalus balansas tarp darbo dydžio atliekamo per vieną procesoriaus darbo taktą ir galimybės kelti taktinį dažnį vystant technologinį procesą.
21. AMD Opteron™ procesorius gaminamas pačiomis naujausiomis technologijomis, naudojant SOI (Silicon on Insulator) technologiją, kuri išsiskiria naujoms galimybėms kelti procesoriaus taktinį dažnį ir produktyvumą.
22. AMD Opteron™ 4 branduolių sistema turi galimybę naudoti AMD Virtualization™ (AMD-V) privalumus.
23. Pagrindinės specializuotų procesorių branduolių kūrimo veikloje dalyvaujančios kompanijos yra Tensilica, ARC Cores, Hewlett Packard ir STMicroelectronics. Jų veiklos "ideologija" panaši, bet skirtingi uždaviniai ir rinka.
Komentarų nėra:
Rašyti komentarą