Què és AVX-512 i per què Intel ho mata?

La CPU del vostre dispositiu realitza milions de càlculs cada segon i és responsable del funcionament de l'ordinador. Treballant amb la CPU hi ha la Unitat de Processament Aritmètic (ALU), que és responsable de les tasques matemàtiques i està impulsada pel microcodi de la CPU.

Ara, aquest microcodi de la CPU no és estàtic i es pot millorar, i una d'aquestes millores va ser el conjunt d'instruccions AVX-512 d'Intel. Tanmateix, Intel està preparat per matar AVX-512, eliminant definitivament la seva funcionalitat de les seves CPU. Però perquè? Per què Intel mata AVX-512?

MAKEUSEO VÍDEO DEL DIA

Com funciona una ALU?

Abans de conèixer el conjunt d'instruccions AVX-512, és essencial entendre com funciona una ALU.

Com el seu nom indica, la Unitat de Processament Aritmètic s'utilitza per realitzar tasques matemàtiques. Aquestes tasques inclouen operacions com la suma, la multiplicació i els càlculs de coma flotant. Per dur a terme aquestes tasques, l'ALU utilitza circuits digitals específics de l'aplicació, que són impulsats pel senyal de rellotge de la CPU.

Per tant, la velocitat de rellotge d'una CPU defineix la velocitat a la qual es processen les instruccions a l'ALU. Per tant, si la vostra CPU funciona amb una freqüència de rellotge de 5 GHz, l'ALU pot processar 5 mil milions d'instruccions en un segon. Per aquest motiu, el rendiment de la CPU millora a mesura que augmenta la velocitat del rellotge.

Dit això, a mesura que augmenta la velocitat del rellotge de la CPU, augmenta la quantitat de calor generada per la CPU. Per aquest motiu, els usuaris avançats utilitzen nitrogen líquid quan fan overclock dels seus sistemes. Malauradament, aquest augment de la temperatura a altes freqüències impedeix que els fabricants de CPU augmentin la freqüència del rellotge per sobre d'un determinat llindar.

barra de tasques que es mostra a la pantalla completa de Windows 10

Llavors, com ofereix un processador de nova generació un millor rendiment en comparació amb les iteracions anteriors? Bé, els fabricants de CPU utilitzen el concepte de paral·lelisme per augmentar el rendiment. Aquest paral·lelisme es pot aconseguir utilitzant una arquitectura multinucli on s'utilitzen diversos nuclis de processament diferents per millorar la potència computacional de la CPU.

Una altra manera de millorar el rendiment és utilitzar un conjunt d'instruccions SIMD. En termes simples, una instrucció de dades múltiples d'instrucció única permet que l'ALU executi la mateixa instrucció en diferents punts de dades. Aquest tipus de paral·lelisme millora el rendiment d'una CPU i l'AVX-512 és una instrucció SIMD que s'utilitza per augmentar el rendiment d'una CPU quan realitza tasques específiques.

Com arriben les dades a l'ALU?

Ara que tenim una comprensió bàsica de com funciona una ALU, hem d'entendre com les dades arriben a l'ALU.

Per arribar a l'ALU, les dades s'han de moure a través de diferents sistemes d'emmagatzematge. Aquest viatge de dades es basa en la jerarquia de memòria d'un sistema informàtic. A continuació es fa una breu visió general d'aquesta jerarquia:

Memòria secundària: La memòria secundària d'un dispositiu informàtic consta d'un dispositiu d'emmagatzematge permanent. Aquest dispositiu pot emmagatzemar dades de manera permanent, però no és tan ràpid com la CPU. Per això, la CPU no pot accedir a les dades directament des del sistema d'emmagatzematge secundari.
Memòria primària: El sistema d'emmagatzematge principal consta de memòria d'accés aleatori (RAM). Aquest sistema d'emmagatzematge és més ràpid que el sistema d'emmagatzematge secundari, però no pot emmagatzemar dades de manera permanent. Per tant, quan obriu un fitxer al vostre sistema, es mou del disc dur a la memòria RAM. Dit això, fins i tot la memòria RAM no és prou ràpida per a la CPU.
Memòria cau: La memòria cau està incrustada a la CPU i és el sistema de memòria més ràpid d'un ordinador. Aquest sistema de memòria es divideix en tres parts, a saber, el Memòria cau L1, L2 i L3 . Qualsevol dada que hagi de processar l'ALU es mou del disc dur a la memòria RAM i després a la memòria cau. Dit això, l'ALU no pot accedir a les dades directament des de la memòria cau.
Registres de la CPU: El registre de la CPU d'un dispositiu informàtic és de mida molt petita i, segons l'arquitectura de l'ordinador, aquests registres poden contenir 32 o 64 bits de dades. Un cop les dades es mouen a aquests registres, l'ALU pot accedir-hi i realitzar la tasca en qüestió.

Què és AVX-512 i com funciona?

El conjunt d'instruccions AVX 512 és la segona iteració d'AVX i va arribar als processadors d'Intel l'any 2013. Abreviatura de Advanced Vector Extensions, el conjunt d'instruccions AVX es va introduir per primera vegada a l'arquitectura Xeon Phi (Knights Landing) d'Intel i més tard va arribar al servidor d'Intel. processadors a les CPU Skylake-X.

A més, el conjunt d'instruccions AVX-512 va arribar als sistemes basats en el consumidor amb l'arquitectura Cannon Lake i més tard va ser recolzat per les arquitectures Ice Lake i Tiger Lake.

per què Chrome necessita tanta memòria?

L'objectiu principal d'aquest conjunt d'instruccions era accelerar les tasques que implicaven compressió de dades, processament d'imatges i càlculs criptogràfics. Oferint el doble de potència de càlcul en comparació amb les iteracions anteriors, el conjunt d'instruccions AVX-512 ofereix guanys de rendiment substancials.

Aleshores, com va duplicar Intel el rendiment de les seves CPU mitjançant l'arquitectura AVX-512?

Bé, com s'ha explicat anteriorment, l'ALU només pot accedir a les dades presents al registre d'una CPU. El conjunt d'instruccions Advanced Vector Extensions augmenta la mida d'aquests registres.

A causa d'aquest augment de mida, l'ALU pot processar diversos punts de dades en una sola instrucció, augmentant el rendiment del sistema.

Pel que fa a la mida del registre, el conjunt d'instruccions AVX-512 ofereix trenta-dos registres de 512 bits, que és el doble en comparació amb el conjunt d'instruccions AVX anterior.

Per què Intel acaba amb AVX-512?

Com s'ha explicat anteriorment, el conjunt d'instruccions AVX-512 ofereix diversos avantatges computacionals. De fet, biblioteques populars com TensorFlow utilitzen el conjunt d'instruccions per proporcionar càlculs més ràpids a les CPU que admeten el conjunt d'instruccions.

Aleshores, per què Intel desactiva AVX-512 als seus recents processadors Alder Lake?

Bé, els processadors Alder Lake són diferents dels més antics fabricats per Intel. Mentre que els sistemes més antics utilitzaven nuclis que funcionaven amb la mateixa arquitectura, els processadors Alder Lake utilitzen dos nuclis diferents. Aquests nuclis de les CPU del llac Alder es coneixen com Nuclis P i E i estan alimentats per diferents arquitectures.

la millor manera de transferir fotos de l'iPhone a l'ordinador

Mentre que els nuclis P utilitzen la microarquitectura Golden Cove, els nuclis E utilitzen la microarquitectura Gracemont. Aquesta diferència en les arquitectures impedeix que el planificador funcioni correctament quan es poden executar instruccions concretes en una arquitectura però no en l'altra.

En el cas dels processadors Alder Lake, el conjunt d'instruccions AVX-512 n'és un exemple, ja que els nuclis P tenen el maquinari per processar les instruccions, però els nuclis E no.

Per aquest motiu, les CPU d'Alder Lake no admeten el conjunt d'instruccions AVX-512.

Dit això, la instrucció AVX-512 es pot executar en determinades CPU d'Alder Lake on Intel no les hagi fusionat físicament. Per fer el mateix, els usuaris han de desactivar els nuclis electrònics durant la BIOS.

Es necessita AVX-512 en chipsets de consumidors?

El conjunt d'instruccions AVX-512 augmenta la mida del registre d'una CPU per millorar-ne el rendiment. Aquest augment del rendiment permet que les CPU trinquin els números més ràpidament, permetent als usuaris executar algorismes de compressió de vídeo/àudio a velocitats més ràpides.

Dit això, aquest augment del rendiment només es pot observar quan la instrucció definida en un programa està optimitzada per executar-se al conjunt d'instruccions AVX-512.

Per aquest motiu, les arquitectures de conjunts d'instruccions com l'AVX-512 són més adequades per a les càrregues de treball del servidor, i els chipsets de qualitat del consumidor poden funcionar sense conjunts d'instruccions complexos com l'AVX-512.