Pour les articles homonymes, voirPenguin.
Penguin (ouGoogle Penguin) est le nom de code[1] d'une mise à jour de l'algorithmePageRank deGoogle qui a été annoncée le[2].
La mise à jour avait pour objectif de réduire le positionnement dessites Web qui violaient lesGoogle’s Webmaster Guidelines[3] en utilisant des techniques deréférencement abusif (spamdexing), tels que lekeyword stuffing[4], lecloaking[5], la participation à des échanges de liens[6], laduplication délibérée de contenu[7] et autres.
La mise à jour Penguin a été introduite le. Google ne lui a donné un nom officiel que 2 jours plus tard[1].
Selon les estimations de Google[2], Penguin touche environ 3,1 % des requêtes en anglais et environ 3 % des requêtes dans des langues comme l'allemand, le chinois et l'arabe. L'impact est plus grand pour les langues où leréférencement abusif est plus fréquent.
Avant Penguin, Google a publié des mises à jour de son algorithmePageRank sous le nom de codePanda[8]. La première de ces mises à jour a été publiée en. Le but des mises à jour Panda était de réduire le positionnement des sites Web qui fournissaient uneexpérience utilisateur médiocre. Pour identifier ces sites, un algorithme d'apprentissage automatique développé par l'informaticien Navneet Panda était utilisé, d'où le nom de code des mises à jour[9]. L'algorithme avait été développé par des techniques d'intelligence artificielle à partir d'évaluations faites par des humains sur l'expérience utilisateur d'un grand nombre de sites.
En, une mise à jour basée sur lamise en page des sites a été publiée[10]. Cette mise à jour visait a réduire le positionnement des pages qui affichaient peu d'information sur la partie de la page visible sans utilisation de labarre de défilement[11].
Penguin vise aussi à améliorer l'expérience utilisateur, mais en mettant plutôt l'accent sur la réduction du positionnement des sites utilisant leréférencement abusif. Les mises à jour Panda ne se préoccupaient pas des référencements abusifs. Google cherche donc à empêcher les webmasters de faire duBlack hat pour offrir aux internautes des contenus de qualité.
Deux jours après l'introduction de la mise à jour, Google a publié un formulaire derétroaction destiné à deux catégories d'utilisateur :
Google avait aussi précédemment publié un formulaire de réexamen dans lesGoogle Webmaster Tools pour les 700,000 sites qui avaient reçu unmessage électronique indiquant que ces sites présentaient des liens suspects.
Une première mise à jour de cet algorithme a eu lieu. Cette mise à jour, selonMatt Cutts, devait toucher moins d'un dixième d'un pour cent des recherches en langue anglaise.
Google Penguin 2.0 a été déployé le[12]. Il s'agit du quatrième lancement du filtre. La mise à jour impacterait 2,3 % des résultats de recherche anglophones. Cette version intègre désormais l'algorithme Penguin aux mises à jour quotidiennes de Google.
Google Penguin 2.1 a été déployé le. Cette version de Penguin apparaît comme la suite de la version précédente et semble être mineure. D'après Matt Cutts, elle n'impacterait qu'environ 1% de l'ensemble des résultats de recherche.
Google Penguin 3.0 a été déployé le. L'objectif de cette version est d'améliorer encore la détection d'abus de liens et notamment la détection de réseaux de sites développés uniquement dans le but de créer des liens artificiels. Cette mise à jour a été déployée sur une longue période puisque Google a indiqué au début du mois de que les mouvements remarqués par les webmasters étaient dus à la mise à jour Google Penguin 3.0 lancée six semaines plus tôt.