2013 m. sausio 12 d., šeštadienis

Pačių naujausių AMD procesorių sandaros, darbo principų ir charakteristikų apžvalga




AMD K10

K10 architektūra yra vystoma jau nuo 2007 metų, todėl iš esmės yra gana pasenusi. Kaip tyčia ant nosies yra revoliucinių „Bulldozer“ procesorių pasirodymas, bet duomenų apie juos vis dar nėra daug. Vis dėlto pačią architektūrą pasistengsiu apžvelgti kiek įmanoma plačiau, nes jau rytoj būtent ši AMD architektūra bus aktuali namų vartotojams, kai tuo tarpu K10 jau bus pamiršta.

K10 turi pirmtakę apie kurią nebuvo daug šnekėta. Kaip paaiškės vėliau iš mano aprašymo, pati K10 nėra jau tokia revoliucinė, kaip buvo skelbta. Detaliau sulyginus šias architektūras ir jų veikimo principus pasidaro aišku, kad tai tik patobulinta K8, kuri savyje kažko kardinaliai pakeisto neneša. Per daug nesigilindamas į K10 pradėsiu apžvalgą nuo šios architektūros neženkliai patobulintos versijos, kuri buvo pristatyta 2009 metais ir gavo pavadinimą K10.5. Beje, visa kompiuterio platforma komplektuojama su 4xxx serijos „Radeon“ vaizdo plokštėm ir šios architektūros procesoriais gavo pavadinimą „Dragon“. Esminis K10 ir K10.5 skirtumas yra pagaminimo technologija (tech. procesas), K10 buvo gaminamas pagal 65nm, tuo tarpu K10.5 jau naudojos 45nm gaminimo technologijos privalumais.

Рисунок

pav. Pirmojo K10 architektūros procesoriaus palyginimas su ankstesniais AMD procesoriais. (paimta iš tomshardware.com)

 

Рисунок

pav. Dviejų branduolių K8 architektūros ir keturių branduolių K10 architektūros procesorių palyginimas (paimta iš ixbt.com)


Kaip matome   paveikslėlyje, kartu su nauja architektūra esminiai nauji komponentai buvo trečiojo lygmens spartinančioji atmintis ir patobulinta sistemos magistralė „Hyper-Transport 3.0“. Tačiau buvo ir daugiau patobulinimų, apie kuriuos ir papasakosiu žemiau pateiktoje medžiagoje.

Galima pamatyti, kad nors tranzistorių gaminimo technologija sumažėjo, vis dėlto dėl papildomų dviejų branduolių AMD inžinieriams teko paaukoti daugiau vietos. Lustas tapo didesnis nors ir visi branduoliai buvo apjungti į vieną.


pav. 128 bitų pralaidumo atminties valdiklis prieš 64 bitų pralaidumo valdiklį (paimta iš amd.com)


Viena iš didesnių K10 naujovių – naujas atminties valdiklis. K8 architektūroje buvo naudojamas vienas 128 bitų atminties valdiklis, kurį galima buvo traktuoti kaip du apjungtus 64 bitų valdiklius. Kaip matome 2.9 paveikslėlyje, K10 architektūroje yra realizuoti du nepriklausomi 64 bitų valdikliai, kurie leidžia ženkliai sumažint kreipties laiką į atmintį. 64 bitų atskiri valdikliai yra efektyvesni už vieną 128 bitų būtent dėl to, kad šiuo metu naudojama atmintis yra 64 bitų. . Taigi, kai K8 architektūros procesoriui reikia nuskaityti duomenis tik iš vieno atminties bloko, jis to padaryti negali, tenka nuskaitinėt iš dviejų, taip didinant vėlinimą. Tokiu būdu iš K10 atminties valdiklio išgaunamas dvigubas pralaidumas, nes jis gali nuskaitinėti duomenis nepriklausomai.

K10 architektūra nesugebėjo parodyti jokių ypatingų rezultatų. Be to pirmieji egzemplioriai, kurie turėjo kodinius branduolių pavadinimus „Agena“ ir „Barcelona“ be viso to pagarsėjo dar ir taip vadinama TLB (Transliacijos asociacinis buferis) klaida. Ši klaida sutinkama visuose keturių branduolių B2 revizijos AMD procesoriuose ir gali išvesti sistemą iš rikiuotės stipriai ją apkraunant. Ypač didelę problemą klaida keldavo serverių segmente, kur sistemos nesklandumai skaudžiai atsiliepdavo jų savininkui. Vėliau buvo išleistas papildinys, kuris atjungdavo dalį loginių procesoriaus blokų, taip priversdamas jį dirbt stabiliai, tačiau labai sumažindamas bendrą našumą. Klaida buvo ištaisyta B3 revizijoje.

pav. Esminiai K10 technologiniai pranašumai prieš K8 (paimta iš amd.com)

·         Didesnis tranzistorių skaičius ir naujoji trečiojo lygmens spartinančioji atmintis, kuri apjungia procesorius.

·         SSE instrukcijų blokų pralaidumas padidintas nuo 64 bitų iki 128 bitų.

·         Pralaidumas tarp antrojo lygio spartinančiosios atminties ir atminties valdiklio taip pat padidintas iki 128 bitų

·         Pagerinta išsišakojimų nuspėjimo technologija.

K10 architektūra daug geriau nuspėja perėjimus ir atsišakojimus. Dėka šito pagerėja nuspėjimų tikslumas, o kuo tikslesnis perėjimų nuspėjimas, tuo efektyviau procesorius gali užkrauti savo vykdomuosius blokus.

Taip pat dvigubai padidintas gražinimo steko dydis. K8 architektūrai, vykdant ilgą užklausų grandinę, galima situacija, kai naujojo pradinio adreso įrašymui į steką neužtenka vietos. Tokiu būdu išsišakojimų nuspėjimas darosi neįmanomas. Dėka šio patobulinimo, tokio persipildymo galimybė ženkliai sumažinta.

·         Beeilė komandų užkrovimo technologija.

K8 ir „NetBurst“ architektūros procesoriai iškrauna apdorotus duomenis tik po to kai gauna naujus ir tai sulėtina našumą, nes dalis vykdomųjų procesoriaus blokų stovi „be darbo“. Savo ruožtu K10 turi galimybę naujus duomenis įkrauti dar neiškrovus senų.

pav. Supaprastinta K10 ir K8 architektūrų branduolio sandaros schema (paimta iš wikipedia.com)


pav. Procesoriaus AMD „Phenom II X6 1100T Black Edition“ sandaros chema. (paimta iš amd.com)


Šis procesorius turi šešis branduolius, kurie turi atskirą antrojo lygio ir bendrą trečiojo lygio spartinančiąją atmintį. Nors pavaizduota tik DDR2, tačiau procesorius turi ir DDR3 atminties kontrolerį. „Crossbar“ tipo sujungimas (kai į matricą turinčią daug išėjimų ir įėjimų sujungiami reikalingi įrenginiai) ir „HyperTransport“ magistralė.

lentelė. Phenom II šešių branduolių procesorių charakteristikų lentelė

2.3 lentelė. Phenom II keturių branduolių procesorių charakteristikų lentelė

lentelė. Athlon II keturių branduolių procesorių charakteristikų lentelė

2.5 lentelė. Vieno branduolio Sempron procesorių charakteristikų lentelė

Model number – procesoriaus modelis.

Step.(stepping) – revizija, procesoriaus versija.

Freq.– darbo dažnis.

Turbo – dažnis naudojant technologiją „Turbo Core“.

L2 cache – antrojo lygmens spartinančioji atmintis.

L3 cache – trečiojo lygmens spartinančioji atmintis.

HT – Hyper transport magistralės darbo dažnis.

Multi. – procesoriaus dažnio daugiklis.

Voltage – procesoriaus darbo įtampa.

TDP – išskiriamos šilumos kiekis vatais.

Socket – lizdo tipas.

Release date – pasirodymo data.

 

AMD bulldozer

Naujoji dar neišleista, bet jau pristatyta AMD kompanijos architektūra. Ši architektūra bus gaminama pagal 32nm technologinį procesą, o pirmieji viešajai rinkai skirti egzemplioriai bus prieinami jau netrukus.

Pasak AMD atstovų ši architektūra bus visiškai išsiskirianti nuo prieš tai buvusių K10 ir K8 (nors tą patį galima buvo girdėti ir prieš K10 pasirodymą). Pirmą kartą AMD realizuos Intel „Hyper-threading“ technologijos analogą. Taip pat „Bulldozer“ palaikys visiškai naujų instrukcijų rinkinį (SSE 4.1, SSE 4.2, CVT16, AVX ir XOP). Dar vienas nuo Intel nukopijuotas žingsnis – vaizdo branduolio integracija į procesoriaus lustą. Namų rinkai skirti „Bulldozer“ architektūros procesoriai palaikys iki 8 branduolių, tuo tarpu serverių segmentui bus siūlomi iki 16 branduolių turintys procesoriai.

pav. Lygiagretus daugiasrautis apdorojimas, blokinė schema, privalumai. (paimta iš amd.com)


Taigi, pasak AMD atstovų jų „Hyper-threading“ analogas bus kur kas sėkmingesnis (to ir reiktų tikėtis, nes Intel technologijai jau bemaž 9 metai). Technologijos esmė tame, kad kiekvienas sveikųjų skaičių išskaičiavimo blokas galės dirbti su savo srautu. Būtent tą ir matome pavaizduota 2.13 paveikslėlyje.

pav. Lygiagretus daugiasrautis apdorojimas vieno branduolio kristale palyginimas su dviejų branduolių apdorojimu. (paimta iš amd.com)


 Iš dalies pateisinantis pačią architektūrą pavadinimas – „Bulldozer“. Tikėtina, kad šie procesoriai galės dirbti žemesniais dažniais lyginant su konkurentais, kai tuo tarpu našumas bus daug geresnis. Skritingi „Bulldozer“ lusto komponentai galės formuoti modulius, kurių kiekvienas iš esmės galės virsti visaverčiais dviem branduoliais. Tokiu būdu AMD gali sukurti 8 branduolių procesorių, panaudodama mažesnį lusto plotą ir tranzistorių kiekį palyginus (jei būtų toks procesorius) su K10 architektūra. Be visą ko, operacinė sistema matys tikrus 8 loginius procesorius, o tam kad paskirstyt duomenų srautą procesorių viduje (kaip ta daro HT), nereikės papildomų tvarkiklių, nes tuo pasirūpins pati procesoriaus architektūra. Viskas atrodytų gražu, tačiau tikėtina, kad gausim apgaulingą kiekį branduolių turinčius procesorius. Viską paaiškina marketingas. Juolab, jeigu gausim realią aštuonių branduolių spartą, niekam ir nekils noro skųstis tokia “apgaulinga“ sparta.

pav. Lygiagretus daugiasrautis apdorojimas dviejų branduolių kristale. (paimta iš amd.com)


Pačios AMD kompanijos teigimu, toks vidaus įrenginys bus vadinamas moduliu. Iš esmės, kaip galima pamatyt 2.15 paveikslėlyje modulis turi savyje du apdorojančius branduolius ir bendrą padedančiųjų blokų sistemą.

AMD ne tik įvedė revoliucinį „Hyper-threading“ analogą į savo sistemą, bet ir sugebėjo perimti stipriąsias konkurentų procesorių savybes: bendroji antrojo lygmens spartinančioji atmintis ir padidintas dekoderio kanalų skaičius, jų dabar keturi. Toks dekoderio kanalų skaičius leis per vieną taktą dekoduoti iki 4 instrukcijų (naudojant makrosusiliejimą, kai tipinės instrukcijų poros yra apjungiamos į vieną iki aštuonių). Tuo tarpu K10 gali įvykdyti iki trijų (naudojant makrosusiliejimą iki šešių) instrukcijų, o „Nehalem“ architektūros procesoriai iki keturių (naudojant makrosusiliejimą iki penkių) instrukcijų. Toks sprendimas leis geriau apkrauti išskaičiavimo modulius, kas turėtų gerai atsiliepti bendrajam našumui.

Pirmas įspūdis kurį sudaro „Bulldozer“ architektūra yra labai teigiamas, tačiau kol kas viskas yra tik “ant popierio“ ir aklai pasikliauti AMD reklamuojama architektūra nereikėtų. Juolab, netrukus turėtų pasirodyti procesoriai kodiniu pavadinimu „Zambezi“, kurie ir galės apginti AMD pozicijas realioje situacijoje.

Kaip matome iš 2.3, 2.4, 2.5 lentelių AMD siūlomų procesorių gama yra kiek didesnė nei Intel kompanijos. Kol kas AMD užbaiginėja savo senai naudojamos K10.5 architektūros erą. Kad architektūra buvo nevykusi sakyti negalima, tačiau reikėtų pastebėti, kad kompanija kiek uždelsė su naujovėm. K10 tebuvo patobulinta K8 ir radikalių pasikeitimų į procesorių našumą įnešt negalėjo. Nepaisant keleto naujų modulių, tokių kaip - planuotojas, naujas atminties valdiklis ar šakų nuspėjimo mechanizmas, K10 architektūra nieko naujo neatnešė, nes pats operacijų vykdymo mechanizmas išliko tas pats. To ko nepadarė K10, turėtų padaryti naujoji „Bulldozer“ architektūra. Jau dabar aišku, kad mūsų laukia revoliuciniai sprendimai, kurie teoriškai yra pažangesni ne tik už senus K10 architektūros sprendimus, bet ir už naujosios Intel „Sandy Bridge“ architektūros novatoriškumus. Deja, „Bulldozer“ procesoriai dar nėra išleisti, todėl realiai vertinti situaciją šių procesorių atžvilgiu kol kas yra neįmanoma.


Komentarų nėra:

Rašyti komentarą

Tinklaraščio archyvas

Etiketės