Arm Mali-G77 GPU - пълните входове и изходи

Автор: Randy Alexander
Дата На Създаване: 3 Април 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Arm Mali-G77 GPU - пълните входове и изходи - Технологии
Arm Mali-G77 GPU - пълните входове и изходи - Технологии

Съдържание


Наред с новото си процесорно ядро ​​Cortex-A77, Arm представи GPU от следващо поколение, предназначено за смартфони от следващо поколение SoC. Mali-G77, без да се бърка с новия дисплей процесор Mali-D77, бележи напускането на Arm's Bifrost архитектурата и преминаването към Valhall.

След малко ще вникнем в фините детайли на новата архитектура. Първо, ще прескочим веднага какво трябва да очакват потребителите по отношение на повишаване на производителността.

Преглед на производителността на Mali-G77

Arm може да се похвали с 40-процентово увеличение на графичната производителност при следващите поколения устройства Mali-G77 в сравнение с днешните модели Mali-G76. Това число отчита процеса, както и архитектурните подобрения. Mali-G77 може да се конфигурира от 7 до 16 шейдърни ядра и всяко ядро ​​е почти с еднакъв размер като G76 ядрото. Това означава, че смартфоните от висок клас вероятно ще се доставят със сходни графични ядра, както днес - някъде в ниските тийнейджъри. Лесно, това ни позволява да направим някои спекулативни оценки на производителността спрямо съществуващите чипсети.


Разглеждайки популярния бенчмарк на Manhattan GFXBench, увеличението на производителността с 40 процента отваря значителна преднина спрямо хардуера на настоящото поколение. Следващото поколение чип Adreno от Qualcomm ще се нуждае от значително подобрение на производителността, за да поддържа нивото на игралното поле. Изглежда таблиците се обръщат в полза на Arm.

Архитектурно съобразено, игровата производителност увеличава 20 до 40%, докато машинното обучение печели 60% тласък

Въз основа на този доста груб балпаркинг, 10-ядрен Mali-G77 (конфигурация, която често виждаме от Huawei) изглежда едва ли не най-върховия линейен мобилен графичен хардуер на това поколение. 12-ядрената конфигурация, която обикновено се вижда в Exynos на Samsung, осигурява голяма преднина за най-новия графичен процесор на Arm. Разбира се, реалните показатели ще зависят от други фактори, включително възел на процес, GPU кеш памет, конфигурация на LPDDR памет и вида на приложението, което тествате. Затова вземете горната графика с обилна доза сол.


По отношение на новата архитектура, Arm заявява, че Mali-G77 предлага средно 30-процентно подобрение на енергийната ефективност и плътността на работа. Има и огромен 60-процентен тласък за приложения за машинно обучение, благодарение на точката поддръжка на INT8 продукт. Очакванията за игровата производителност са зададени някъде между 20 и 40 процента увеличение, в зависимост от заглавието и вида на графичното натоварване на офертата.

За да разберем как точно Arm е постигнал това повишаване на производителността, нека по-задълбочено се потопим в архитектурата.

Запознайте се с Валхол, наследник на Бифрост

Vahall е скала на GPU архитектура от второ поколение. Това е двигател за изпълнение с широка крива 16, което по същество означава, че GPU изпълнява 16 инструкции паралелно на цикъл, на процесор, на ядро. Това е от 4 и 8 в Bifrost.

Другите нови архитектурни характеристики включват динамично планиране на инструкции, управлявано изцяло от хардуер, и изцяло нов набор от инструкции, който запазва оперативната еквивалентност на Bifrost. Други включват поддръжка за Arm's AFBC1.3 формат на компресия, FP16 изобразяване на цели, многопластово изобразяване и върхови изходни шейдъри.

Mali-G77 прави 33% повече математика успоредно от G76.

Ключовете за разбиране на основните архитектурни промени се намират чрез изследване на изпълнителната единица вътре в ядрото. Тази част от графичния процесор е отговорна за смачкване на броя.

Вътре в двигателя за изпълнение

В Bifrost всяко ядро ​​на GPU съдържаше три двигателя за изпълнение или два в случай на някои дизайни на Mali-G52 от по-нисък клас. Всеки двигател съдържа i-кеш, регистър файл и устройство за управление на основата. В Mali-G72 всеки двигател се справя с 4 инструкции на цикъл, което нарасна до 8 през миналата година Mali-G76. Разпространението между тези три ядра позволява 12 и 24 32-битови плаваща точка (FP32), обединени многократно и акумулирайки (FMA) инструкции на цикъл.

При Valhall и Mali-G77 има само един двигател на изпълнение във всяко ядро ​​на GPU. Както и преди, този двигател разполага с блока за управление на основата, регистъра и icache, който сега е споделен между две процесорни единици. Всеки процесор обработва 16 основни инструкции на цикъл, за обща пропускателна способност от 32 FP32 FMA инструкции на ядро. Това е 33-процентно увеличение на пропускателната способност на инструкциите през Mali-G76.

Arm е преминала от три до само една единица за изпълнение на ядрото на GPU, но вече има две процесорни единици в ядрото на G77.

В допълнение, всеки от тези обработващи единици съдържа два нови математически функционални блока. Новата единица за преобразуване (CVT) обработва основните инструкции за цяло число, логика, клон и преобразуване. Специалната функционална единица (SFU) ускорява цялостното умножение, деленията, квадратния корен, логаритмите и други сложни цели числа.

Стандартният FMA модул вижда няколко ощипвания, поддържащи 16 инструкции за FP32 на цикъл, 32 FP16 или 64 точки инструкции за продукт на INT8. Тези оптимизации водят до 60-процентно повишаване на производителността в приложенията за машинно обучение.

Quad Texture Mapper

Другата ключова промяна в Mali-G77 е въвеждането на четириъгълен картограф за текстура, в сравнение с двоен структурен картограф в предишното поколение. Макетът на текстурата е отговорен за картографирането на 3D полигони в една сцена в двумерното представяне, което виждате на екрана. Той е отговорен за вземане на проби, интерполация и филтриране за изглаждане на ъгъл и преместване на съдържание, за да се избегнат сурови и нискокачествени ръбове.

Остава на разположение нискотарифното сглаждане, за да подпомогне качеството на изображението, но удвоението на производителността на текстурата е основната полза тук. Текстурният блок сега обработва 4 билинейни текстила на часовник нагоре от 2 преди, 2 трилинейни текстила на часовник и се справят с по-бързото филтриране FP16 и FP32.

Квадратният картограф на текстурата е разделен на два пътя, като осигурява по-къс тръбопровод за нишки, които удрят съдържание в кеша. Пропускащият път, който обработва преобразуването на формат и декомпресирането на текстурата, разполага с по-широк интерфейс към L2 кеша. Това е полезно и за натоварването на машинното обучение, което често може да се наложи да извлече нови данни от паметта.

Съчетаване на всичко заедно в Mali-G77

Arm направи редица други ощипвания към Mali-G77, за да съвпадне с основните промени в архитектурата на Valhall. Управляващият блок е опростен благодарение на дизайна на единичната единица за изпълнение, докато вътрешният динамичен планировчик всъщност позволява по-гъвкаво издаване на инструкции във всяко ядро. С по-висока пропускателна способност във всяко ядро, траекторията на данни също е по-къса и по-ниска в латентността, до само 4 цикъла от 8 преди.

Новият дизайн е по-добре приведен в съответствие с API на Vulkan, опростявайки дескрипторите на драйвери, за да намали режийните разходи на водача за подобряване на производителността „до метал“.

В обобщение, Mali-G72 и Valhall правят важни промени от Bifrost, които обещават значително повишаване на производителността на приложенията за игри и машинно обучение. Важното е, че дизайнът се вписва в същите бюджети за мощност и площ като Bifrost, като гарантира, че мобилните устройства ще могат да предлагат по-висока производителност, без да се притесняват от разходите за топлина, мощност и силиций. Въз основа на прогнозите за производителност, Mali-G77 би трябвало да може да даде на следващото поколение на Adreno от Qualcomm добър старт за парите си.

Не е ужасно трудно да получите безплатни приложения безплатно. За съжаление, по-голямата част от „безплатните“ оферти са схематични и разработчиците често страдат от това. Пиратството в Android е сери...

С Лятото точно зад ъгъла има вероятност да имате ваканция. Това обикновено означава напускане на страната и любимите ви предавания зад, Как ще хапете Game of Throne в Италия или Япония, ако е ограниче...

Избор На Сайтове