La plate-formeApollo Lake avec un cœur Goldmont de 14 nm a été dévoilée lors de l’Intel Developer Forum (IDF) à Shenzhen, en Chine, en avril 2016[1]. L’architecture Goldmont emprunte beaucoup aux processeursSkylake, de sorte qu’elle offre une augmentation des performances de plus de 30 % par rapport à la plate-forme Braswell précédente, et elle peut être utilisée pour mettre en œuvre des appareils bas de gamme économes en énergie, notamment descloudbooks, desnetbooks 2-en-1, des petits PC, des caméras IP et des systèmes de divertissement embarqués[2],[3].
Le décodeur peut décoder 3 instructions par cycle.
Le séquenceur de microcodes peut envoyer 3μops par cycle pour l’allocation dans les stations de réservation.
Le retrait soutient un taux maximal de 3 par cycle.
Amélioration de laprédiction de branchement qui dissocie le pipeline de récupération du décodeur d’instructions.
Fenêtre d’exécution dans le désordre plus grande et tampons qui permettent une exécution dans le désordre plus poussée sur les types d’instructions sur entier, FP/SIMD et mémoire.
Exécution et désambiguïsation de la mémoire entièrement dans le désordre. La microarchitecture Goldmont peut effectuer une lecture et un stockage par cycle (contre une lectureou un stockage par cycle dans la microarchitecture Silvermont). Le pipeline d’exécution de la mémoire inclut également une amélioration du TLB de deuxième niveau avec 512 entrées pour les pages de 4 Ko.
Le cluster d’exécution sur entiers possède trois pipelines et peut exécuter jusqu’à trois opérations ALU simples sur entier par cycle.
Les instructions SIMD en entier et en virgule flottante s’exécutent dans un moteur de 128 bits de large. Le débit et la latence de nombreuses instructions ont été améliorés, y compris PSHUFB avec un débit de 1 cycle (contre 5 cycles pour la microarchitecture Silvermont) et de nombreuses autres instructions SIMD avec un débit doublé.
Le débit et la latence des instructions pour l’accélération du chiffrement/déchiffrement (AES) et de la multiplication sans report (PCLMULQDQ) sont considérablement améliorés.
Nouvelles instructions avec l’algorithme de hachage sécurisé accéléré par le matériel,SHA-1 etSHA256.
Prise en charge de l’instructionRDSEED pour la génération de nombres aléatoires répondant à la norme NIST SP800-90C.
La latence des instructions PAUSE est optimisée pour permettre une meilleure efficacité énergétique.