AMD K10
K10 architektūra yra vystoma jau nuo 2007 metų, todėl iš esmės yra gana pasenusi. Kaip tyčia ant nosies yra revoliucinių „Bulldozer“ procesorių pasirodymas, bet duomenų apie juos vis dar nėra daug. Vis dėlto pačią architektūrą pasistengsiu apžvelgti kiek įmanoma plačiau, nes jau rytoj būtent ši AMD architektūra bus aktuali namų vartotojams, kai tuo tarpu K10 jau bus pamiršta.
K10 turi pirmtakę apie kurią nebuvo daug šnekėta. Kaip paaiškės vėliau iš mano aprašymo, pati K10 nėra jau tokia revoliucinė, kaip buvo skelbta. Detaliau sulyginus šias architektūras ir jų veikimo principus pasidaro aišku, kad tai tik patobulinta K8, kuri savyje kažko kardinaliai pakeisto neneša. Per daug nesigilindamas į K10 pradėsiu apžvalgą nuo šios architektūros neženkliai patobulintos versijos, kuri buvo pristatyta 2009 metais ir gavo pavadinimą K10.5. Beje, visa kompiuterio platforma komplektuojama su 4xxx serijos „Radeon“ vaizdo plokštėm ir šios architektūros procesoriais gavo pavadinimą „Dragon“. Esminis K10 ir K10.5 skirtumas yra pagaminimo technologija (tech. procesas), K10 buvo gaminamas pagal 65nm, tuo tarpu K10.5 jau naudojos 45nm gaminimo technologijos privalumais.
pav. Pirmojo K10 architektūros procesoriaus palyginimas su ankstesniais AMD procesoriais. (paimta iš tomshardware.com)
pav. Dviejų branduolių K8 architektūros ir keturių branduolių K10 architektūros procesorių palyginimas (paimta iš ixbt.com)
Kaip matome paveikslėlyje, kartu su nauja architektūra esminiai nauji komponentai buvo trečiojo lygmens spartinančioji atmintis ir patobulinta sistemos magistralė „Hyper-Transport 3.0“. Tačiau buvo ir daugiau patobulinimų, apie kuriuos ir papasakosiu žemiau pateiktoje medžiagoje.
Galima pamatyti, kad nors tranzistorių gaminimo technologija sumažėjo, vis dėlto dėl papildomų dviejų branduolių AMD inžinieriams teko paaukoti daugiau vietos. Lustas tapo didesnis nors ir visi branduoliai buvo apjungti į vieną.
pav. 128 bitų pralaidumo atminties valdiklis prieš 64 bitų pralaidumo valdiklį (paimta iš amd.com)
Viena iš didesnių K10 naujovių – naujas atminties valdiklis. K8 architektūroje buvo naudojamas vienas 128 bitų atminties valdiklis, kurį galima buvo traktuoti kaip du apjungtus 64 bitų valdiklius. Kaip matome 2.9 paveikslėlyje, K10 architektūroje yra realizuoti du nepriklausomi 64 bitų valdikliai, kurie leidžia ženkliai sumažint kreipties laiką į atmintį. 64 bitų atskiri valdikliai yra efektyvesni už vieną 128 bitų būtent dėl to, kad šiuo metu naudojama atmintis yra 64 bitų. . Taigi, kai K8 architektūros procesoriui reikia nuskaityti duomenis tik iš vieno atminties bloko, jis to padaryti negali, tenka nuskaitinėt iš dviejų, taip didinant vėlinimą. Tokiu būdu iš K10 atminties valdiklio išgaunamas dvigubas pralaidumas, nes jis gali nuskaitinėti duomenis nepriklausomai.
K10 architektūra nesugebėjo parodyti jokių ypatingų rezultatų. Be to pirmieji egzemplioriai, kurie turėjo kodinius branduolių pavadinimus „Agena“ ir „Barcelona“ be viso to pagarsėjo dar ir taip vadinama TLB (Transliacijos asociacinis buferis) klaida. Ši klaida sutinkama visuose keturių branduolių B2 revizijos AMD procesoriuose ir gali išvesti sistemą iš rikiuotės stipriai ją apkraunant. Ypač didelę problemą klaida keldavo serverių segmente, kur sistemos nesklandumai skaudžiai atsiliepdavo jų savininkui. Vėliau buvo išleistas papildinys, kuris atjungdavo dalį loginių procesoriaus blokų, taip priversdamas jį dirbt stabiliai, tačiau labai sumažindamas bendrą našumą. Klaida buvo ištaisyta B3 revizijoje.
pav. Esminiai K10 technologiniai pranašumai prieš K8 (paimta iš amd.com)
· Didesnis tranzistorių skaičius ir naujoji trečiojo lygmens spartinančioji atmintis, kuri apjungia procesorius.
· SSE instrukcijų blokų pralaidumas padidintas nuo 64 bitų iki 128 bitų.
· Pralaidumas tarp antrojo lygio spartinančiosios atminties ir atminties valdiklio taip pat padidintas iki 128 bitų
· Pagerinta išsišakojimų nuspėjimo technologija.
K10 architektūra daug geriau nuspėja perėjimus ir atsišakojimus. Dėka šito pagerėja nuspėjimų tikslumas, o kuo tikslesnis perėjimų nuspėjimas, tuo efektyviau procesorius gali užkrauti savo vykdomuosius blokus.
Taip pat dvigubai padidintas gražinimo steko dydis. K8 architektūrai, vykdant ilgą užklausų grandinę, galima situacija, kai naujojo pradinio adreso įrašymui į steką neužtenka vietos. Tokiu būdu išsišakojimų nuspėjimas darosi neįmanomas. Dėka šio patobulinimo, tokio persipildymo galimybė ženkliai sumažinta.
· Beeilė komandų užkrovimo technologija.
K8 ir „NetBurst“ architektūros procesoriai iškrauna apdorotus duomenis tik po to kai gauna naujus ir tai sulėtina našumą, nes dalis vykdomųjų procesoriaus blokų stovi „be darbo“. Savo ruožtu K10 turi galimybę naujus duomenis įkrauti dar neiškrovus senų.
pav. Supaprastinta K10 ir K8 architektūrų branduolio sandaros schema (paimta iš wikipedia.com)
pav. Procesoriaus AMD „Phenom II X6 1100T Black Edition“ sandaros chema. (paimta iš amd.com)
Šis procesorius turi šešis branduolius, kurie turi atskirą antrojo lygio ir bendrą trečiojo lygio spartinančiąją atmintį. Nors pavaizduota tik DDR2, tačiau procesorius turi ir DDR3 atminties kontrolerį. „Crossbar“ tipo sujungimas (kai į matricą turinčią daug išėjimų ir įėjimų sujungiami reikalingi įrenginiai) ir „HyperTransport“ magistralė.
lentelė. Phenom II šešių branduolių procesorių charakteristikų lentelė
2.3 lentelė. Phenom II keturių branduolių procesorių charakteristikų lentelė
lentelė. Athlon II keturių branduolių procesorių charakteristikų lentelė
2.5 lentelė. Vieno branduolio Sempron procesorių charakteristikų lentelė
Komentarų nėra:
Rašyti komentarą