Arm Cortex-A77 - всичко, което трябва да знаете

Автор: Randy Alexander
Дата На Създаване: 2 Април 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Arm Cortex-A77 - всичко, което трябва да знаете - Технологии
Arm Cortex-A77 - всичко, което трябва да знаете - Технологии

Съдържание


Заедно с новия си графичен процесор Mali-G77 и дисплейния процесор Mali-D77, Arm представи най-новия си високопроизводителен процесорен дизайн - Cortex-A77. Както и през миналата година Cortex-A76, Cortex-A77 е проектиран за приложения от първокласно ниво, изискващи консумация на ръка с ниска консумация на енергия. Всичко от смартфони до лаптопи и доста вероятно отвъд.

С Cortex-A77, Arm е насочил максималните инструкции за цикъл / часовник (IPC) повишаване на производителността, което може да управлява през Cortex-A76. Тактовите честоти, консумацията на енергия и площта са проектирани така, че да останат приблизително в един и същ терен, но новото ядро ​​може да се счупи чрез повече инструкции наведнъж. За да направите това, Arm е проектирала още по-широко ядро ​​от миналата година и е направила редица подобрения, за да поддържа ядрото на процесора захранвано с неща, които трябва да се правят. Но преди да стигнем до това, нека се потопим в номерата за обзор и висока производителност на високо ниво.


Постигане на целеви показатели

През август 2018 г. Arm нехарактерно сподели пътната карта на процесора до 2020 г. От дизайна на Cortex-A73 до Hercules за 2016 г., компанията обещава увеличение на производителността с 2.5 пъти увеличение в 2.5 пъти. Невероятна част от тази огромна проекция беше осъществена с основната смяна на микроархитектурата с Cortex-A76, по-високите съвременни тактови скорости и преминаването от 16 на 10 и сега 7nm производство с 5 nm, което следва. Около 1,8 пъти печалбите от пътната карта вече бяха постигнати до миналата година, а Cortex-A77 осигурява приблизително 20 процента допълнително увеличение на IPC. Това ни изправя по пътя към 2.5x целта на Arm, въпреки че мобилните устройства с ограничен бюджет и мощност не очакват да видят всички тези печалби.

За сравнение, миналата година Cortex-A76 осигури около 30-35% увеличение спрямо Cortex-A75. Тази година разглеждаме по-заглушени, но все още значителни, 20% печалба от IPC между A77 и A76. Това е добра новина, защото означава повече производителност, докато се придържате към подобни топлинни и енергийни ограничения, както преди. Компромисът е, че A77 е с около 17 процента по-голям от A76, така че ще струва малко повече по отношение на силициевата площ. Ако искате сравнение с десктоп лидерите, AMD успя да увеличи 15-процентовото увеличение на IPC между Zen2 и Zen +, докато IPC на Intel остава практически статичен от години.Разбира се, тук говорим за различни пазарни сегменти, но това показва как дизайнерският екип на Arm постигна впечатляващи печалби през последните поколения.


Предлага се 20% повишаване на производителността за следващите поколения Cortex-A77 базирани SoC

Изводът тук е, че A76 отбеляза голяма микроархитектурна промяна с огромни увеличения на производителността, докато ние се върнахме към подобрения в нивото на оптимизация с A77. С това не трябва да се потопим в новото в Arm Cortex-A77.

Cortex-A77 надгражда микроархитектурата A76

Ключът към разбирането на разликата между Cortex-A77 и A76 е да разберете какво се разбира под „по-широк“ дизайн на ядрото. По същество говорим за способността да изпълняваме повече инструкции за всеки часовник цикъл, което увеличава пропускателната способност на ядрото. Има две важни части за постигането на това право - увеличаване на броя на изпълнителните единици за обработка и гарантиране, че тези единици се поддържат добре захранвани с данни. Нека започнем с последната част и се съсредоточете в частите за изпращане, кеш и разклонителен предсказател на SoC.

Cortex-A77 вижда 50-процентен тласък за изпращане на ширина, до шест инструкции на цикъл от четири с A76. Това означава, че повече инструкции се насочват към ядрото за изпълнение за всеки цикъл на часовника за по-голям потенциал на производителност. Прозорецът за изпълнение извън поръчката също е по-голям в резултат, увеличавайки се до 160 записа, за да разкрие повече паралелизъм. Има познат кеш на инструкции от 64K, докато буферът за насочване на клони (BTB), който съдържа адреси за прогноза за клона, е с 33 процента по-голям от преди, за да се справи с растежа в паралелни инструкции. Тук няма нищо необичайно, това е по същество по-широка версия на миналогодишния дизайн.

По-интригуващото допълнение отпред е изцяло новият 1.5K MOP кеш, който съхранява макро-Ops (MOPs), които се подават обратно от декодиращата единица. Армейската CPU архитектура декодира инструкции от приложението на потребителя в по-малки макро-операции и след това надолу в микро-операции, които ядрото за изпълнение разбира. Можете да видите това на диаграмата по-горе в раздела за декодиране. MOP кешът се използва за намаляване на разходите за пропуснати клонове и флъшове, тъй като запазвате макроопсите, вместо да ги декодирате отново, и увеличава общата пропускателна способност на ядрото. Извлечения от MOP, а не i-cache заобикалят етапа на декодиране, спестявайки един цикъл. Arm заявява, че MOP кешът може да достигне 85 процента или повече честота на удари в редица натоварвания, което го прави много полезно допълнение към стандартния i-кеш.

Преминавайки надолу към основната част на процесора за изпълнение, обърнете внимание на добавянето на четвърти ALU и втори клон. Този четвърти ALU увеличава общата честотна лента на процесора с 50 процента. Този допълнителен ALU е способен на основни инструкции за един цикъл (като ADD и SUB) плюс двуциклени цели операции, такова умножение. Две от другите ALU могат да се справят само с основни инструкции за един цикъл, докато крайната единица се зарежда с по-усъвършенствани математически операции като разделяне, умножение-натрупване и др. Второто клонче вътре в ядрото за изпълнение удвоява броя на едновременните разклонения на скача ядрото може да се справи, което е полезно в случаите, когато две от шестте изпратени инструкции са скокове на клони. Това звучи малко странно, но вътрешните тестове в Arm разкриха ползи от производителността от приемането на този втори модул.

Cortex-A77 предлага подобрен паралелизъм и ново поемане на кешове, които предварително се извличат

Други промени в ядрото на процесора включват добавяне на втори тръбопровод за криптиране AES. Сега тръбопроводите за съхранение на данни разполагат със специални портове за издаване, за да удвоят честотната лента на въпроса за паметта. Тези портове преди това бяха споделени с ALUs, които понякога могат да станат затруднение. Съществува и подобрител на данни от ново поколение за подобряване на енергийната ефективност, като същевременно увеличава честотната лента към системната DRAM.

Част от тази система в Cortex-A77 също разполага с изцяло нова система за предварително изтегляне на системата. Това подобрява производителността на паметта въз основа на широкия обхват на ядрото на процесора, капацитета на кеша и закъсненията и конфигурациите на подсистемата на паметта в крайните устройства. Специалният хардуер за разговори с модула за динамично планиране (DSU) като част от клъстера на DynamIQ CPU, който следи използването на споделения L3 кеш. Ядрото се отличава с динамични нива на разстояние и агресивност, за да намали използването на кеша в ситуации, в които честотната лента на L3 е ограничена от други ядра на процесора. По-високопроизводителните ядра като Cortex-A77 са по-склонни да насищат DSU достъпа до паметта, докато по-ниските мощностни ядра като A55 е малко вероятно.

Поставяне на всичко заедно

Има много малки промени в Cortex-A77, които допринасят за някои съществени разлики спрямо предшественика му. С две думи, новият MOP кеш на A77s, комбиниран с по-широк и по-дълъг прозорец с инструкции, помага да се запазят подредените ALU, клон и памет, заети с неща за вършене. Дизайнът на Powerhouse Cortex-A76 е разширен, за да подобри своята производителност още повече с A77, без да разчита на по-високите тактови скорости.

Най-голямото увеличение на производителността на Cortex-A77 пристига под формата на математика с цяло число и плаваща запетая. Това се потвърждава от вътрешните показатели на Arm, които показват повишаване на производителността от 20 до 35 процента съответно в целочислени стойности за целочисления и плаваща запетая. Подобренията в лентата на паметта са някъде между 15 и 20 процента, като отново подчертават, че най-големите печалби идват под формата на смачкване на броя. Като цяло тези подобрения дават средно повишение на A77 с 20 процента спрямо предишното поколение. Може да видим и някои по-допълнителни, по-пределни печалби в резултат на по-напредналите 7nm производствени процеси по-късно тази година или в началото на 2020 година.

По отношение на смартфоните, Cortex-A77 захранвани SoC са предназначени за високоефективни, водещи продукти. Arm напълно очаква дизайна на електроцентралата да използва 4 + 4 бита. LITTLE основните аранжировки. Като се има предвид увеличената пропускателна способност и лекото нарастване на размера на площта на A77, вероятно ще видим, че дизайнерите на SoC продължават да намаляват тенденцията 1 + 3 + 4 или 2 + 2 + 4. С едно или две мощни големи ядра с по-големи кеши и по-високи часовници, подкрепени от 2 или 3 ядра A77 с по-малки размери на кеша и по-ниски часовници, за да спестите енергия и площ. В крайна сметка Cortex-A77 пише добри неща за чипове на смартфони и разрастващия се пазар за винаги свързани лаптопи, базирани на Arm. Внимавайте за силиконовите обяви по-късно тази година.

Днес Au свали опаковките от най-новия си флагман - Au Zenfone 6. Въпреки че Au Zenfone 5Z беше доста смартфон за 2018 г., Zenfone 6 е всичко друго.Най-голямата промяна при Au Zenfone 6 е неговата зави...

$ 499Купи от B & HPoitiveФантастични характеристики и изпълнение достъпни Страхотно качество на изграждане Жак за слушалки Бутон за бързи действия Разширяващо се хранилище Страхотен потребителски ...

Интересен Днес