Arm Mali-G77 GPU - täydelliset ja hyvät puolet

Kirjoittaja: Randy Alexander
Luomispäivä: 3 Huhtikuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Arm Mali-G77 GPU - täydelliset ja hyvät puolet - Teknologioiden
Arm Mali-G77 GPU - täydelliset ja hyvät puolet - Teknologioiden

Sisältö


Uuden Cortex-A77-CPU-ytimen ohella Arm on julkistanut seuraavan sukupolven GPU: n, joka on tarkoitettu seuraavan sukupolven älypuhelinten SoC-laitteille. Mali-G77, jota ei pidä sekoittaa uuden Mali-D77-näyttöprosessorin kanssa, merkitsee Arm's Bifrost -arkkitehtuurin lähtöä ja siirtymistä Valhalliin.

Tutkimme uuden arkkitehtuurin yksityiskohdat hetkessä. Ensinnäkin hyppäämme suoraan siihen, mitä käyttäjien odotetaan odottavan suorituskyvyn paranemisen suhteen.

Mali-G77 -suorituskyky

Arm tarjoaa jopa 40 prosenttia lisääntynyttä grafiikan suorituskykyä seuraavan sukupolven Mali-G77 -laitteilla verrattuna nykyisiin Mali-G76 -malleihin. Tämä luku ottaa huomioon sekä prosessin että arkkitehtoniset parannukset. Mali-G77 on konfiguroitavissa 7-16 varjostinytimestä, ja jokainen ydin on melkein täsmälleen samankokoinen kuin G76-ydin. Tämä tarkoittaa, että huippuluokan älypuhelimet toimittavat todennäköisesti samanlaiset GPU-ydinmäärä kuin nykyään - jossain alaikäisissä. Kätevästi tämä antaa meille mahdollisuuden tehdä joitain spekulatiivisia suoritusarvioita olemassa olevia piirisarjoja vastaan.


Kun tarkastellaan suosittua Manhattan GFXBench -vertailuarvoa, 40 prosentin suorituskyvyn lisäys avaa huomattavan etumatkan nykyisen sukupolven laitteistoihin. Qualcommin seuraavan sukupolven Adreno-siru tarvitsee oman merkittävän suorituskyvyn päivityksen, jotta pelikenttä pysyy tasalla. Pöydät näyttävät kääntyvän Arm-puolueen hyväksi.

Arkkitehtuurin suhteen pelaamisen suorituskyky nousee 20–40%, kun taas koneoppiminen ansaitsee 60%

Tämän melko raa'an palloilun perusteella 10-ytinen Mali-G77 (kokoonpano, jota näemme usein Huaweista) näyttää olevan melkein reunastamaan tämän sukupolven huippuluokan mobiiligrafiikkalaitteita. 12 ytimen kokoonpano, yleensä Samsungin Exynos-sovelluksessa, tarjoaa suuren johdon Armin uusimmalle GPU: lle. Todelliset vertailuarvot riippuvat tietenkin muista tekijöistä, kuten prosessisolmusta, GPU-välimuistista, LPDDR-muistin kokoonpanosta ja testaamastasi sovellustyypistä. Joten ota yllä oleva kaavio moitteettomalla annoksella suolaa.


Pelkästään uuden arkkitehtuurin suhteen Arm toteaa, että Mali-G77 tarjoaa keskimäärin 30 prosenttia parannuksen energiatehokkuuteen ja suorituskyvyn tiheyteen. INT8 dot -tuen ansiosta koneoppimissovellukset saavat valtavan lisäyksen 60 prosentilla. Pelien suorituskykyodotukset asetetaan välillä 20–40 prosenttia, nimikkeestä ja tarjolla olevista grafiikkatyötavoista riippuen.

Otetaan syvemmälle arkkitehtuuriin ymmärtääksesi tarkalleen kuinka Arm on saavuttanut tämän esityskorotuksen.

Tapaa Valhall, Bifrostin seuraaja

Vahall on Armin toisen sukupolven skalaarinen GPU-arkkitehtuuri. Se on 16-leveinen loimi-toteutusmoottori, mikä tarkoittaa olennaisesti, että GPU suorittaa 16 käskyä rinnakkain sykliä, prosessointiyksikköä ja ydintä kohti. Se on korkeintaan 4 ja 8 leveässä Bifrostissa.

Muita uusia arkkitehtonisia ominaisuuksia ovat dynaaminen käskyohjelmointi, jota hallitaan kokonaan laitteistossa ja täysin uusi käskyjoukko, joka säilyttää operatiivisen vastaavuuden Bifrostin kanssa. Muita tukia ovat Arm: n AFBC1.3-pakkausmuoto, FP16-mallinnuskohteet, kerrostettu renderointi ja vertex-shader-ulostulot.

Mali-G77 tekee 33% enemmän matematiikkaa samanaikaisesti kuin G76.

Avaimet tärkeimpien arkkitehtonisten muutosten ymmärtämiseen löytyvät tutkimalla ytimen sisällä olevaa suoritusyksikköä. Tämä osa GPU: sta on vastuussa numeroiden murskaamisesta.

Suoritusmoottorin sisällä

Bifrost-sovelluksessa jokainen GPU-ydin sisälsi kolme tai kaksi moottoria joissakin alemman tason Mali-G52-malleissa. Jokainen moottori sisältää i-välimuistin, rekisteritiedoston ja loimen ohjausyksikön. Mali-G72 -mallissa jokainen moottori käsittelee 4 käskyä jaksoa kohden, ja se nousi 8: een viime vuoden Mali-G76: ssa. Näiden kolmen ytimen läpi leviäminen mahdollistaa 12 ja 24 32-bittisen liukulukujen (FP32) sulatetun kerrannaisen keräämisen (FMA) käskyn jaksoa kohti.

Valhallin ja Mali-G77: n kanssa jokaisessa GPU-ytimessä on vain yksi suoritusmoottori. Kuten aikaisemmin, tässä moottorissa on loimen ohjausyksikkö, rekisteröinti ja icache, joka on nyt jaettu kahdelle prosessointiyksikölle. Jokainen prosessointiyksikkö käsittelee 16 loimikäskyä jaksoa kohden, yhteensä 32 FP32 FMA-käskyä ydintä kohden. Se on 33 prosentin lisäys Mali-G76: n ohjeiden läpimenoon.

Arm on siirtynyt kolmesta yhdeksi suoritusyksiköksi GPU-ydintä kohden, mutta G77-ytimessä on nyt kaksi käsittelyyksikköä.

Lisäksi kukin näistä prosessointiyksiköistä sisältää kaksi uutta matemaattista toimintolohkoa. Uusi muuntoyksikkö (CVT) käsittelee kokonaisluku-, logiikka-, haara- ja muuntamisohjeet. Erityistoimintoyksikkö (SFU) nopeuttaa kokonaislukukertolaskuja, jakautumisia, neliöjuuria, logaritmeja ja muita monimutkaisia ​​kokonaislukutoimintoja.

Tavallisessa FMA-yksikössä on havaittu muutamia säädöksiä, jotka tukevat 16 FP32-käskyä jaksoa kohden, 32 FP16- tai 64 INT8-pistetuoteohjetta. Nämä optimoinnit parantavat 60 prosentin suorituskykyä koneoppimissovelluksissa.

Quad Texture Mapper

Toinen tärkeä muutos Mali-G77: ssä on nelikäsittelykartterin käyttöönotto, verrattuna edellisen sukupolven kaksoisrakenteisiin karttaajiin. Tekstuurikarttaja vastaa kuvauksen 3D-monikulmioiden kartoittamisesta näytön näkemään 2D-esitykseen. Sen tehtävänä on näytteenotto, interpolointi ja suodatus kulman ja liikkuvan sisällön tasoittamiseksi kovien, heikkolaatuisten reunojen välttämiseksi.

Edullinen anti-aliasointi pysyy paikallaan kuvanlaadun parantamiseksi, mutta tekstuuritehokkuuden kaksinkertaistaminen on tässä suurin etu. Tekstuuriyksikkö prosessoi nyt 4 bilineaarista tekstiiliä / kello, 2 aikaisemmasta, 2 trilineaarista tekstiiliä / kello, ja käsittelee nopeampaa FP16- ja FP32-suodatusta.

Quad-rakennekartta on jaettu kahteen polkuun, mikä tarjoaa lyhyemmän putkilinjan ketjuille, jotka lyövät välimuistin sisältöä. Miss-polulla, joka käsittelee formaatin muuntamista ja tekstuurin purkamista, on laajempi käyttöliittymä L2-välimuistiin. Tästä on apua myös koneoppimisen työmäärissä, joissa saattaa olla tarpeen vetää uutta tietoa muistista.

Yhdistämällä kaikki Mali-G77-laitteeseen

Arm on tehnyt Mali-G77: lle useita muita säätöjä samanaikaisesti Valhall-arkkitehtuurin merkittävien muutosten kanssa. Ohjauslohko on yksinkertaistettu yhden suoritusyksikön suunnittelun ansiosta, kun taas sisäinen dynaaminen aikataulu mahdollistaa joustavamman käskyn antamisen kunkin ytimen sisällä. Jokaisessa ytimessä on suurempi suorituskyky, ja myös tierata on lyhyempi ja pienempi viive, vain 4-jaksoon 8: sta aiemmin.

Uusi malli on myös paremmin yhdenmukaistettu Vulkan API: n kanssa, yksinkertaistamalla kuljettajan kuvauksia alempaan kuljettajan yläpuolelle parantaen ”metalli-ominaisuutta”.

Yhteenvetona voidaan todeta, että Mali-G72 ja Valhall tekevät Bifrostista tärkeitä muutoksia, jotka lupaavat merkittäviä suorituskyvyn parannuksia pelaamista ja koneoppimissovelluksia varten. Tärkeää on, että muotoilu sopii samoihin teho- ja aluebudjetteihin kuin Bifrost, mikä varmistaa, että mobiililaitteet pystyvät tarjoamaan enemmän huipputehoa murehtimatta lämmön, virran ja piin kustannuksista. Suorituskykyennusteiden perusteella Mali-G77: n pitäisi pystyä antamaan Qualcommin seuraavan sukupolven Adrenolle hyvä rahaa.

Intialaiet käyttäjät voivat nyt käyttää Google Aitantia ilman Internet-yhteyttä.Vodafone Idean käyttäjät voivat oittaa numeroon 000-800-9191-000 k...

Vaimollani ja minulla on erittäin paljon Google-avutajakekeitä kotia - omitamme kolme Google Home Minitä, tavallinen Google-koti, Google Net Hub ja ueita Pixel-puhelimia. Käytä...

Portaalin Artikkelit