Arm Cortex-A77 - kaikki mitä sinun tarvitsee tietää

Kirjoittaja: Randy Alexander
Luomispäivä: 2 Huhtikuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Arm Cortex-A77 - kaikki mitä sinun tarvitsee tietää - Teknologioiden
Arm Cortex-A77 - kaikki mitä sinun tarvitsee tietää - Teknologioiden

Sisältö


Uuden Mali-G77-grafiikkaprosessorin ja Mali-D77-näyttöprosessorin kanssa Arm on julkistanut uusimman korkean suorituskyvyn CPU-suunnittelun - Cortex-A77. Kuten viime vuoden Cortex-A76: ssa, myös Cortex-A77 on suunniteltu premium-tason sovelluksille, jotka vaativat Armin allekirjoituksen alhaista virrankulutusta. Kaikkea älypuhelimista kannettaviin tietokoneisiin ja melko todennäköisesti muuallakin.

Cortex-A77: n avulla Arm on kohdistanut enimmäisohjeet sykliä / kelloa kohti (IPC), jota se pystyy hallitsemaan Cortex-A76: lla. Kellotaajuudet, virrankulutus ja pinta-ala on suunniteltu pysymään suunnilleen samassa pallokeskuksessa, mutta uusi ydin voi räpätä lisäämällä ohjeita kerralla. Arm on suunnitellut tätä varten entistä laajemman ytimen kuin viime vuonna ja tehnyt useita parannuksia pitääkseen prosessorin ytimen täydessä tehtävässä. Mutta ennen kuin pääsemme siihen, sukellaan korkean tason yleiskatsaukseen ja suorituskykynumeroihin.


Lyö suorituskykytavoitteet

Elokuussa 2018 Arm jakoi epätavallisesti prosessorin etenemissuunnitelman vuoteen 2020 saakka. Vuodesta 2016 Cortex-A73 - vuoteen 2020 ulottuvaan Hercules-malliin yritys lupaa 2,5-kertaisen laskennan suorituskyvyn. Kohtuullinen palasuus tästä valtavasta projektiosta saatiin aikaan suurella mikroarkkitehtuurin muutoksella Cortex-A76: lla, korkeammilla nykyaikaisilla kellonopeuksilla ja siirrymällä 16: sta 10: een ja nyt 7 nm: n valmistukseen 5 nm: n seurauksena. Noin 1,8-kertainen etenemissuunnitelman eduista oli jo saavutettu viime vuonna, ja Cortex-A77 tarjoaa noin 20 prosenttia lisää IPC-lisäystä. Tämä antaa meille hyvän tavan Arm-laitteen 2,5x-tavoitteeseen, vaikka mobiililaitteet, joilla on rajoitettu virrankulutus ja lämpöenergia, eivät odota näkevän kaikkia näitä hyötyjä.

Vertailun vuoksi viime vuoden Cortex-A76 antoi noin 30-35 prosentin lisäyksen Cortex-A75: n verrattuna. Tänä vuonna tarkastelemme hiljaisempaa, mutta silti merkittävää 20 prosentin IPC-voittoa A77: n ja A76: n välillä. Tämä on hyvä uutinen, koska se tarkoittaa enemmän suorituskykyä samalla kun pysyt samanlaisissa lämpö- ja tehorajoituksissa kuin ennen. Kompromissi on, että A77 on noin 17 prosenttia suurempi kuin A76, joten se maksaa hieman enemmän piipinta-alan suhteen. Jos haluat vertailun pöytätietokoneiden johtajiin, AMD hallitsi 15 prosentin IPC-lisäystä Zen2: n ja Zen +: n välillä, kun taas Intelin IPC on pysynyt käytännössä staattisena vuosien ajan.Tietenkin puhumme täällä erilaisia ​​markkinasegmenttejä, mutta tämä osoittaa, kuinka Armin prosessorisuunnittelutiimi on saavuttanut vaikuttavia voittoja viime sukupolvien aikana.


20%: n suorituskyvyn parannus on tarjolla seuraavan sukupolven Cortex-A77 -pohjaisille SoC-laitteille

Tässä tapahtuu, että A76 merkitsi suurta mikroarkkitehtonista muutosta, jolla oli valtavia suorituskyvyn lisäyksiä, kun taas olemme palanneet A77: n optimointitason parannuksiin. Poiketen siitä, sukellaanpa mitä uutta Arm Cortex-A77: ssä on.

Cortex-A77 perustuu A76-mikroarkkitehtuuriin

Cortex-A77: n ja A76: n välisen eron ymmärtämisen avain on ymmärtää, mitä ”laajemmalla” ydinrakenteella tarkoitetaan. Pohjimmiltaan puhumme kyvystä suorittaa enemmän ohjeita jokaiselle kellojaksolle, mikä lisää ytimen suorituskykyä. Tämän oikeuttamiseen on kaksi tärkeää osaa - prosessointiyksiköiden määrän lisääminen ja sen varmistaminen, että nämä yksiköt pidetään hyvin syötteinä tiedoilla. Aloitetaan jälkimmäisestä osasta ja keskitytään SoC: n lähetys-, välimuisti- ja haaraennusteosiin.

Cortex-A77 näkee 50 prosentin lisäyksen lähetysleveyteen, jopa kuusi käskyä sykliä kohti neljästä A76: n kanssa. Tämä tarkoittaa enemmän ohjeita, jotka suuntautuvat suoritussydämeen jokaiselle kellojaksolle suuremman suorituskyvyn saavuttamiseksi. Tilauksen ulkopuolinen suoritusikkuna on myös sen seurauksena suurempi, kasvaen 160 merkintään paljastaen enemmän samansuuntaisuutta. Siellä on tuttu 64 kt: n ohjevälimuisti, kun taas Branch Target Buffer (BTB), jolla on osoitteita haaraennustajalle, on 33 prosenttia suurempi kuin aiemmin kasvun käsittelemiseksi rinnakkaisohjeiden avulla. Mikään tässä ei ole epätavallista, se on pääosin laajempi versio viime vuoden suunnittelusta.

Mielenkiintoisempi etuosan lisäys on täysin uusi 1.5K MOP -välimuisti, joka tallentaa makro-Ops (MOP), jotka syötetään takaisin dekoodausyksiköstä. Arm'n CPU-arkkitehtuuri dekoodaa käyttäjän sovelluksen ohjeet pienempiin makro-operaatioihin ja sitten edelleen mikro-oppeihin, jotka suorituksen ydin ymmärtää. Voit nähdä tämän yllä olevassa kaaviossa dekoodausosassa. MOP-välimuistia käytetään vähentämään jäämättä jääneiden oksien ja aaltojen kustannusrangaistuksia, kun pidät makrooppeja pidempään kuin dekoodaat niitä uudelleen, ja lisäät ytimen yleistä suorituskykyä. Noutot MOP: sta kuin i-välimuistista ohittavat dekoodausvaiheen ja säästävät yhden jakson. Arm toteaa, että MOP-välimuisti voi osua vähintään 85 prosenttia osumaprosenttiin monilla työkuormituksilla, mikä tekee siitä erittäin hyödyllisen lisäyksen tavalliseen i-välimuistiin.

Siirtymällä alas suorittimen ydinosaan, huomaa neljännen ALU: n ja toisen haarayksikön lisääminen. Tämä neljäs ALU lisää prosessorin yleistä numeroa murskailevaa kaistanleveyttä 50 prosentilla. Tämä ylimääräinen ALU kykenee perussyklisiin yhden syklin käskyihin (kuten ADD ja SUB) plus kaksisyklisiin kokonaislukuihin, kuten kertolasku. Kaksi muuta ALU: ta pystyy käsittelemään vain yksisyklisiä perusohjeita, kun taas lopulliseen yksikköön ladataan edistyneempiä matematiikkaoperaatioita, kuten jakaminen, kertominen-kerääminen jne. Toinen haarayksikkö suoritussydämen sisällä kaksinkertaistaa samanaikaisten haarahyppyjen määrän ydin pystyy käsittelemään, mikä on hyödyllistä tapauksissa, joissa kaksi kuudesta lähetetystä ohjeesta on haarahyppy. Tämä kuulostaa hiukan oudolta, mutta Armin sisäinen testaus paljasti suorituskyvyn hyödyt tämän toisen yksikön käyttöönottamisesta.

Cortex-A77 tarjoaa parantuneen rinnakkaisuuden ja uuden esivirityksen välimuiskeihin

Muita CPU-ytimen mukautuksia ovat toisen AES-salausputken lisääminen. Tietojen tallennusputkissa on nyt omistettu kysymysportti kaksinkertaistamaan muistin kysymyskaistanleveys. Nämä satamat jaettiin aiemmin ALU: ien kanssa, joista voi joskus tulla pullonkaula. Siellä on myös seuraavan sukupolven datan täydennysosa, joka parantaa virrankulutusta ja lisää samalla järjestelmän DRAM-kaistanleveyttä.

Osassa tätä Cortex-A77: n järjestelmää on myös täysin uusi ”järjestelmän tietoinen” esisyöttöjärjestelmä. Tämä parantaa muistin suorituskykyä perustuen laajaan CPU-ydinlaskurivalikoimaan, välimuistin kapasiteettiin ja viiveisiin sekä muisti-alijärjestelmän kokoonpanoihin loppulaitteiden sisällä. Omistettu laitteisto keskustelemaan dynaamisen ajoitusyksikön (DSU) kanssa osana DynamIQ CPU-klusteria, joka valvoo jaetun L3-välimuistin käyttöä. Ytimessä on dynaaminen etäisyys ja aggressiivisuus, jotta välimuistin käyttöä voidaan vähentää tilanteissa, joissa L3-kaistanleveyttä rajoittavat muut CPU-ytimet. Suorituskykyisimmät ytimet, kuten Cortex-A77, kylläistävät todennäköisemmin DSU: n muistin käytön, kun taas A55: n kaltaiset pienemmät tehonsydöt eivät todennäköisesti vastaa.

Sovitaan kaikki yhteen

Cortex-A77: een on tehty paljon pieniä muutoksia, jotka lisäävät edeltäjään joitain merkittäviä eroja. Lyhyesti sanottuna A77s: n uusi MOP-välimuisti yhdistettynä laajempaan ja pidempään ohjeikkunaan auttaa pitämään täydennetyn ALU-, haara- ja muistiyksiköt kiireisenä tekemistä varten. Powerhouse Cortex-A76 -mallia on laajennettu parantamaan sen suorituskykyä entisestään A77: lla luottamatta suurempiin kellonopeuksiin.

Suurimmat suorituskyvyn lisäykset Cortex-A77: lle saapuvat kokonaisluvun ja liukulukujen muodossa. Tämän vahvistaa Arm: n sisäiset vertailuarvot, jotka esittelevät 20–35 prosentin suorituskyvyn nousun SPEC-kokonaislukujen ja liukulukujen vertailuindekseissä. Muistin kaistanleveyden parannukset ovat välillä 15 - 20 prosenttia, mikä taas korostaa, että suurimmat hyödyt tapahtuvat numeroiden murskaamisen muodossa. Kaiken kaikkiaan nämä parannukset antavat A77: lle keskimäärin 20 prosentin nousun edelliseen sukupolveen verrattuna. Saatamme nähdä myös joitain muita, marginaalisempia hyötyjä kehittyneiden 7 miljoonan valmistusprosessien seurauksena myöhemmin tänä vuonna tai vuoden 2020 alussa.

Älypuhelimien osalta Cortex-A77-käyttöiset SoC-laitteet on tarkoitettu korkean suorituskyvyn lippulaivatuotteille. Arm odottaa täysin näkevänsä voimalan suunnittelun hyödyntävän 4 + 4 bittiä.LITTLE ydinjärjestelyt. Kun otetaan huomioon A77: n lisääntynyt läpimeno ja pieni kohouma aluekokoon, todennäköisesti SoC-suunnittelijat jatkavat 1 + 3 + 4 tai 2 + 2 + 4 trendiä. Yhdellä tai kahdella voimakkaalla suurella ytimellä, jolla on suuret välimuistit ja korkeammat kellot, ja joita tukee 2 tai 3 A77-ydintä, joiden välimuistikoko on pienempi ja pienemmät kellot, energian ja alueen säästämiseksi. Viime kädessä Cortex-A77 kertoo hyviä asioita älypuhelimien siruille ja kasvavilla markkinoilla aina liitetyille Arm-pohjaisille kannettaville. Pidä silmällä piin ilmoitukset myöhemmin tänä vuonna.

Oppia ottamaan laadukkaita valokuvia voi olla hankala. DLR-laitteen tai pro-tilan aetuten elaaminen puhelimea voi tuntua ratkaiemaan Rubikin kuutio, mutta apua on käillä. Aiantuntijavalokuva...

AirPodit ovat ylivoimaieti uoituimpia langattomat Bluetooth-kuulokkeet noin, mutta hintaan 160 dollaria pop, he eivät todellakaan ole halpoja. iellä on täydellieti hyviä vaihtoehto...

Suosittu