Movatterモバイル変換

Aller au contenu

Hypertext Markup Language

Modifier les liens

Un article de Wikipédia, l'encyclopédie libre.

HTML
HyperText Markup Language

Logo d'HTML5.

Caractéristiques
Extensions	`.htm`,`.html`
Type MIME	`text/html`
PUID	fmt/99
Développé par	World Wide Web Consortium &WHATWG
Version initiale	1993,1989
Type de format	Langage de balisage
Basé sur	Standard Generalized Markup Language
Origine de	XHTML
Norme	HTML living standard
Spécification	Format ouvert
Site web	(en) html.spec.whatwg.org/multipage

modifier -modifier le code -modifier Wikidata

LeHyperText Markup Language, généralement abrégéHTML ou, dans sa dernière version,HTML5, est lelangage de balisage conçu pour écrire lespages web. Il s'agit d'unformat ouvert très utilisé eninformatique.

Comme son nom l'indique, HTML permet d’écrire de l’hypertexte. Il permet aussi de structurersémantiquement le texte, de créer des formulaires de saisie, d’inclure desressources multimédias dont desimages, desvidéos et desprogrammes informatiques. Il a été conçu pour créer des documentsinteropérables avec des équipements informatiques variés ; l’accessibilité du web est ainsi accrue en supportant des équipements destinés aux handicapés^[1].

HTML est souvent utilisé conjointement avec lelangage de programmation JavaScript et desfeuilles de style en cascade (CSS). Il est inspiré duStandard Generalized Markup Language (SGML).

Dénominations

[modifier |modifier le code]

L’anglais « Hypertext Markup Language » se traduit littéralement en « langage de balisage d’hypertexte »^[2]. On utilise généralement lesigle « HTML », parfois même en répétant le mot « langage » comme dans « langage HTML ».Hypertext est parfois écritHyperText pour marquer leT du sigle HTML^{[note 1]}.

Le public non averti parle parfois de HTM au lieu de HTML, HTM étant l’extension de nom de fichier tronquée à trois lettres, une limitation d’ancienssystèmes d’exploitation deMicrosoft.

Évolution du langage

[modifier |modifier le code]

Résumé

[modifier |modifier le code]

Durant la première moitié des années 1990, il n'existe pas de norme du langage et son évolution est dictée par la mise en œuvre des navigateurs Web populaires. En 1995, laRFC 1866 [3] décritHTML 2.0, le premier standard pour HTML. Suivent en 1997 les recommandations duWorld Wide Web Consortium (W3C)HTML 3.2 etHTML 4. Le W3C fonde ensuite HTML surXML, et publieXHTML 1.0 en 2000 etXHTML 1.1 en 2001. L'orientation technique choisie pour la suite du développement de XHTML n'est pas partagée par les fabricants de navigateurs web, et c'est leWeb Hypertext Application Technology Working Group (WHATWG) fondé en 2004 qui développe ce qui devient la version suivante du langage,HTML5. Depuis 2007 le W3C travaille avec le WHATWG, et depuis 2019 seul le standard évolutif du WHATWG, appeléHTML living standard, fait référence.

1989-1993 : Origine

[modifier |modifier le code]

HTML est une des trois inventions fondatrices duWorld Wide Web, avec leHypertext Transfer Protocol (HTTP) et lesadresses web (URL). HTML a été inventé pour écrire des documentshypertextuels liant les différentes ressources d’Internet avec deshyperliens. Aujourd’hui, ces documents sont appelés « page web ». Enaoût 1991, lorsqueTim Berners-Lee annonce publiquement le web surUsenet, il ne cite que le langageStandard Generalized Markup Language (SGML), mais donne l’URL d’un document de suffixe.html^[4].

Dans son livreWeaving the web^[5],Tim Berners-Lee décrit la décision de fonder HTML surSGML comme étant aussi « diplomatique » que technique : techniquement, il trouvait SGML trop complexe, mais il voulait attirer la communauté hypertexte qui considérait queSGML était le langage le plus prometteur pour standardiser le format des documents hypertexte. En outre,SGML était déjà utilisé par son employeur, l’Organisation européenne pour la recherche nucléaire (CERN).

Hormis les hyperliens, plusieurs des premierséléments du langage HTML viennent de SGML. Ils sont notamment utiles pour structurer sémantiquement la documentation technique. Ils comprennent^[6] :

le titre du document (entre les balises<TITLE> et</TITLE>) ;
des sous-titres de 6 niveaux deH1 àH6 ;
les paragraphesP ;
les listes numérotéesOL, non numérotéesUL, et leurs élémentsLI ;
leshyperliensA.

La description de HTML est alors assez informelle et principalement définie par le support desnavigateurs web contemporains. En septembre 1991 Tim Berners-Lee crée laliste de diffusion WWW-talk où les sujets concernant le World Wide Web, dont HTML, peuvent être publiquement discutés.Dan Connolly a aidé à formaliser HTML en application de SGML^[7].

1993 : Apports de NCSA Mosaic

[modifier |modifier le code]

L’état de HTML correspond alors à ce que l’on pourrait appelerHTML 1. Il n’existe cependant aucune spécification portant ce nom, notamment parce que le langage était en pleine évolution. Un effort denormalisation était cependant en cours^[8]. À partir de fin1993, le terme HTML+ est utilisé pour désigner la version future de HTML^[9]^,^[10]. Malgré l’effort de normalisation ainsi initié et jusqu’à la fin desannées 1990, HTML est principalement défini par les implémentations desnavigateurs web.

Avec le navigateurNCSA Mosaic, HTML connaît deux inventions majeures :

d’abord l’invention de l’élémentIMG dansNCSA Mosaic 0.10 permet d’intégrer desimages (dans un premier temps, uniquement auxformats GIF etXBM) auxpages web^[11] ;
ensuite l’invention desformulaires (Mosaic 2.0pre5) rend le web interactif en permettant aux visiteurs de saisir des données dans les pages et de les envoyer auserveur web. Cette invention permet notamment de passer des commandes, et donc d’utiliser le web pour faire ducommerce électronique.

1994 : Apports de Netscape Navigator

[modifier |modifier le code]

Avec l’apparition deNetscape Navigator 0.9 le13 octobre 1994, le support de nombreux éléments de présentation est ajouté : attributs de texte avecFONT, clignotement avecBLINK, centrage avecCENTER, etc.

Le développement de HTML prend alors deux voies divergentes :

d’une part, les développeurs de navigateurs s’attachent à maximiser l’impact visuel des pages web en réponse aux demandes des utilisateurs [12] ;
d’autre part, les concepteurs du Web proposent d’étendre les capacités de description sémantique (logos, notes de bas de page, etc.) et les domaines d’applications (formules mathématiques, tables) de HTML.

Les concepteurs suivent les principes de SGML consistant à laisser la présentation à un langage de style. En l’occurrence, lesfeuilles de style en cascade (CSS) sont prévues pour HTML. Enmars 1995, leWorld Wide Web Consortium (W3C) nouvellement fondé propose le résultat de ses recherches sur HTML+ : le brouillonHTML 3.0. Il comprend notamment le support des tables, des figures et desexpressions mathématiques^[13]. Ce brouillon expire le28 septembre 1995 sans donner de suites directes. Seul le support des tables est rapidement intégré aux navigateurs, notamment parce qu’il accroît beaucoup les possibilités demise en page.

Outre la multiplication des éléments de présentation, les logiciels d’alors produisant et consommant du HTML conçoivent souvent les documents comme une suite de commandes de formatage plutôt que comme un marquage représentant la structure enarbre aujourd’hui appeléeDocument Object Model (DOM). Le manque de structure du HTML alors mis en œuvre est parfois dénoncé comme étant de la « soupe debalises », enanglais :tag soup.

1995-1996 : HTML 2.0

[modifier |modifier le code]

Fin1995, leRFC 1866 [14] décrivantHTML 2.0 est finalisé. Le principal éditeur estDan Connolly. Ce document décrit HTML tel qu’il existait avantjuin 1994, donc sans les nombreuses additions deNetscape Navigator.

1997 : HTML 3.2 et 4.0

[modifier |modifier le code]

Le14 janvier 1997, le W3C publie la spécificationHTML 3.2. Elle décrit la pratique courante observée début1996^[15], donc avec une partie des additions deNetscape Navigator et d’Internet Explorer. Ses plus importantes nouveautés sont la standardisation des tables et de nombreux éléments de présentation.HTML 3.2 précède de peuHTML 4.0 et contient des éléments en prévision du support des styles et des scripts.

Le18 décembre 1997, le W3C publie la spécificationHTML 4.0 qui standardise de nombreuses extensions supportant les styles et les scripts, les cadres (frames) et les objets (inclusion généralisée de contenu).HTML 4.0 apporte également différentes améliorations pour l’accessibilité des contenus^[16] dont principalement la possibilité d’une séparation plus explicite entre structure et présentation du document, ou le support d’informations supplémentaires sur certains contenus complexes tels que les formulaires, les tableaux ou les sigles.HTML 4.0 introduit trois variantes du format, destinées à favoriser l’évolution vers un balisage plus signifiant, tout en tenant compte des limites temporaires des outils de production :

la variante stricte (strict) exclut des éléments et attributs dits « de présentation », destinés à être remplacés par les styles CSS, ainsi que les élémentsapplet etframe qui sont remplacés par l’élémentobject conçu pour être plus apte à l’interopérabilité et à l’accessibilité ;
la variante transitoire (transitional) étend la variante stricte en reprenant les éléments et attributs dépréciés deHTML 3.2, dont les éléments de présentation sont couramment utilisés par leséditeurs HTML de l’époque ;
la varianteframeset normalise la technique des jeux de cadres composant une ressource unique à partir de plusieurs pages web assemblées par le navigateur.

Ces variantes perdurent par la suite sans modifications notables enHTML 4.01 et dans le format de transitionXHTML 1.0 issu de HTML.La dernière spécification de HTML est laversion 4.01 datant du24 décembre 1999. Elle n’apporte que des corrections mineures à laversion 4.0.

2000-2010 : XHTML

[modifier |modifier le code]

Article détaillé :Extensible Hypertext Markup Language.

En 1998,Extensible Markup Language (XML) est standardisé^[17], et génère un fort engouement chez les professionnels. Le développement de HTML en tant qu’application duStandard Generalized Markup Language (SGML) est officiellement abandonné au profit deXHTML, application deExtensible Markup Language (XML). En 2000, XHTML 1.0 est standardisé ; il s'agit d'une simple reformulation de HTML 4 en XML^[18].

Cependant, en2004, des éditeurs denavigateurs web^[19] créent leweb Hypertext Application Technology Working Group (WHATWG) dans le but, notamment, de relancer le développement du format HTML et de répondre aux nouveaux besoins sur une base technologique jugée plus aisément implémentable que celle duXHTML 2.0 en cours de conception. Ceci s’inscrit dans le contexte d’une contestation plus générale du mode de fonctionnement du W3C, réputé trop fermé par une partie des développeurs et designers web^[20].

Le développement deXHTML 2.0 est initialement poursuivi en parallèle, en réponse aux besoins d’autres secteurs du web, tels que les périphériques mobiles, les applications d’entreprise et les applications serveurs^[21]. Puis, enjuillet 2009, le W3C décide la non-reconduction duXHTML 2 Working Group à la fin 2009^[22]. XHTML 2.0 est retiré le 16 décembre 2010^[23].

De 2007 à 2019 : HTML 5

[modifier |modifier le code]

Article détaillé :HTML5.

Enmars 2007, tirant la conséquence des réticences d’une partie de l’industrie et des concepteurs de contenus web face àXHTML 2.0^[24], le W3C relance le développement de HTML et crée un nouveau groupe de travail encadré par Chris Wilson (Microsoft) et initialementDan Connolly (W3C), puisMichael Smith (W3C).

Il s’agit notamment^[25] :

de faire évoluer HTML pour décrire la sémantique des documents mais aussi les applications en ligne ;
de parvenir à un langage extensible viaXML tout en maintenant une version non-XML compatible avec lesanalyseurs syntaxiques (parsers) HTML des navigateurs contemporains ;
et d’enrichir les interfaces utilisateurs avec des contrôles spécifiques : barres de progrès, menus, champs associés à des types de données spécifiques.

Les travaux du WHATWG ont été formellement adoptés enmai 2007 comme point de départ d’une nouvelle spécificationHTML5^[26]. Ce document^[27] a été publié sous forme deWorking Draft le22 janvier 2008.Parmi les principes de conception évoqués par le groupe de travail figurent en particulier^[28] :

la compatibilité des futures implémentations HTML avec le contenu web existant, et la possibilité pour d’anciens agents utilisateurs d’exploiter les futurs contenusHTML 5 ;
une approche pragmatique, préférant les évolutions aux modifications radicales, et adoptant les technologies ou pratiques déjà largement partagées par les auteurs de contenus actuels ;
la priorité donnée, en cas de conflit d’intérêts, aux besoins des utilisateurs sur ceux des auteurs, et par suite, à ceux des auteurs sur les contraintes d’implémentation par les navigateurs ;
le compromis entre la richesse sémantique du langage et l’utilité pratique des solutions disponibles pour remplir l’objectif majeur d’indépendance envers le média de restitution.

Le W3C et le WHATWG ont travaillé ensemble à partir de 2007, les deux groupes de travail ayant pour éditeurIan Hickson. Toutefois, en 2011, les deux groupes ont conclu qu'ils avaient des objectifs différents. Le WHATWG voulait faire continuellement évoluer le standard HTML, tandis que le W3C voulait publier une version définitive de HTML5. À partir de 2012, un groupe de travail du W3C s'est attelé à écrire une recommandation. Le W3C a publié plusieurs recommandations depuis :

28 octobre 2014, HTML5^[29] ;
1^er novembre 2016, HTML 5.1^[30] ;
3 octobre 2017, HTML 5.1 seconde édition^[31] ;
14 décembre 2017, HTML 5.2^[32].

Le 15 mars 2018, la recommandation HTML 3.2^[33] est officiellement retirée par le W3C car remplacée par les nouveaux développements de HTML. De même, les recommandations HTML 4.0^[34], HTML 4.01^[35], HTML5^[36], XHTML 1.0^[37], XHTML 1.1^[38] sont retirées le 27 mars 2018, et les recommandations HTML 5.2^[39] et HTML 5.3^[40] sont retirées le 28 janvier 2021.

Depuis 2011,HTML Living Standard

[modifier |modifier le code]

Enjanvier 2011, des divergences de points de vue entre Ian Hickson (ingénieur chezGoogle), qui écrit la spécification HTML5, et les membres du groupe de travail duW3C conduisent leWHATWG à créerHTML Living Standard (littéralement : standard vivant du HTML), une spécification de HTML prévue pour être en constante évolution, afin de coller avec les développements rapides de nouvelles fonctionnalités par les développeurs de navigateurs^[41](par opposition à des versions numérotées, donc « fixes »).

LeHTML Living Standard a pour but d'inclure leHTML5, et de le développer en permanence^[42]. En particulier, dans la version du22 août 2012, le document de référence^[42] explique que le HTML5 du W3C, publié le22 juin 2012, est basé sur une version duHTML Living Standard, mais que leHTML Living Standard ne s'arrête pas à cette version, et continue à évoluer. Il développe en particulier les différences entre la version W3C (le HTML5) et la versionHTML Living Standard (par exemple, les nouveaux bugs ne sont pas pris en compte dans le HTML5, des différences syntaxiques sont répertoriées, et de nouvelles balises créées par leHTML Living Standard ne sont pas incluses dans le HTML5).

En 2019, le W3C et le WHATWG signent un mémorandum sur leur collaboration à propos de HTML et du DOM. Selon ce mémorandum, le W3C cesse de publier des recommandations séparément, et ils travaillent ensemble sur le standard évolutif du WHATWG^[43].

Description de HTML

[modifier |modifier le code]

HTML se présente sous la forme d’unlangage de balisage dont la syntaxe vient duStandard Generalized Markup Language (SGML).

Syntaxe de HTML

[modifier |modifier le code]

Origines du côté de SGML

[modifier |modifier le code]

Jusqu’à saversion 4.01 comprise, HTML est formellement décrit comme une application de SGML. Mais les développeurs depages Web et de navigateurs Web ont toujours pris des libertés avec les règles syntaxiques de SGML. D'ailleurs, ladocument type definition (DTD) de HTML, soit la description formelle de HTML en SGML, n’a été écrite parDan Connolly que plusieurs années après l’invention de HTML^[7].

Les spécifications successives admettent, par différents biais, que les agents utilisateurs ne sont pas, en pratique, des analyseurs SGML conformes^[44]. Lesnavigateurs Web n’ont jamais été capables de déchiffrer l’ensemble des variations de syntaxe permises par SGML^[45] ; en revanche ils sont généralement capables de rattraper automatiquement de nombreuses erreurs de syntaxe, suivant la première partie de laloi de Postel : « Soyez libéral dans ce que vous acceptez, et conservateur dans ce que vous envoyez » (RFC 791 [46]).

Malgré les libertés prises avec la norme, la terminologie propre à SGML est utilisée : document, élément, attribut, valeur, balise, entité, validité, application, etc. Grâce à la DTD, il est possible de vérifier automatiquement la validité des documents HTML 2, 3.2 ou 4 à l’aide d’un parseur SGML^[47]. Un document HTML valide est un document qui respecte la syntaxe SGML, n’utilise que des éléments et attributs standardisés, et respecte l’imbrication des éléments décrite par le standard. Un document valide n’est cependant pas suffisant pour être conforme à la spécification HTML visée. En effet, outre l’exigence de validité, un document conforme est soumis à d’autres contraintes qui ne sont pas exprimées par la DTD, mais qui le sont par la spécification elle-même. C’est notamment le cas du type de contenu de certains attributs, comme celui de l’attributdatetime : pour être conforme àHTML 4.01, celui-ci doit être lui-même conforme à un sous-ensemble de la normeISO 8601^[48]. Un parseur strictement SGML tel que le validateur HTML du W3C ne peut donc pas garantir la conformité d’un document HTML.

À partir de HTML5, il n'y a plus de DTD^[49].

Syntaxe HTML décortiquée

[modifier |modifier le code]

À l’origine, HTML a été conçu pour baliser (ou marquer) simplement le texte, notamment pour y ajouter des hyperliens. On utilisait un minimum de balises, comme dans le document HTML suivant :

<TITLE>Exemple de HTML</TITLE>Ceci est une phrase avec un<AHREF=cible.html>hyperlien</A>.<P>Ceci est un paragraphe o&ugrave; il n'y a pas d'hyperlien.

Cet exemple contient du texte, cinq balises et une référence d’entité :

<TITLE> est la balise ouvrante de l’élémentTITLE.
</TITLE> est la balise fermante de l’élémentTITLE.
Exemple de HTML est le contenu de l’élémentTITLE.
<A HREF=cible.html> est la balise ouvrante de l’élémentA, avec :
- HREF=cible.html, l’attributHREF dont la valeur estcible.html.
<P> est la balise ouvrante de l’élémentP, dont le contenu estCeci est un paragraphe où il n’y a pas d’hyperlien. La balise fermante de l’élémentP, qui est optionnelle, est ici omise. L’élémentP est implicitement terminé lorsqu’un nouveau paragraphe commence ou que l’élément parent est fermé (cas présent). Dans cet exemple, La balise<P> est utilisée comme s’il s’agissait d’un séparateur de paragraphe, et c’est même ainsi qu’elle est souvent présentée dans les plus anciennes documentations de HTML.
ù est une référence d’entité représentant lecaractère « ù ».
Les balises peuvent être indifféremment écrites en minuscules ou majuscules. L’usage des minuscules devient plus courant car XHTML les impose.

Il ne manque qu’une déclaration de type de document pour que cet exemple constitue un document HTML 2.0 valide^[50].

Structure des documents HTML

[modifier |modifier le code]

Dans les premières années, les documents HTML étaient souvent considérés comme des structures plates, et les balises comme des commandes de style^[51]. Ainsi la balise<p> était considérée comme un saut de ligne, et la balise</p> était ignorée. Ou encore lorsqueJavaScript 1.0 est apparu, il ne donnait accès qu’aux liens et formulaires du document à travers les tableauxdocument.forms etdocument.links.

Avec l’introduction desCascading Style Sheets et duDocument Object Model, il a fallu considérer que les documents HTML ont une véritable structure enarbre, avec un élément racine contenant tous les autres éléments^[52]. Les balises ouvrantes et fermantes de ces éléments restent d’ailleurs optionnelles. Cependant, aujourd’hui, on a tendance à baliser chaque élément^[53] et à indiquer la DTD. À l'exception de l'élément à la racine, chaque élément a exactement un élément parent direct ; cet « arbre du document » est notamment utilisé par la structure de formatage qui en est dérivée pour l’application desfeuilles de style en cascade où chaque élément peut avoir un fond, un bord et une marge propres.

La structure la plus commune en HTML consiste à avoir un élément racinehtml avec deux enfants : un élémenthead pour l'en-tête du document contenant surtout des méta-informations, suivi d'un élémentbody pour le corps du document. L'élémenttitle dans l'élémenthead est obligatoire : il donne un titre au document qui est par exemple affiché en titre d'onglet de navigateur, en titre de résultat demoteur de recherche, et en nom demarque-page.

Structure d’un document HTML

Source HTML

Modèle du document

<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN"><html><head><title>   Exemple de HTML</title></head><body>  Ceci est une phrase avec un<ahref="cible.html">hyperlien</a>.<p>   Ceci est un paragraphe où il n’y a pas d’hyperlien.</p></body></html>

html

head

title

texte

body

texte

a

texte

texte

p

texte

Éléments de HTML

[modifier |modifier le code]

Article détaillé :Élément HTML.

Laversion 4 de HTML décrit 91 éléments^[54]. En suivant la spécification deHTML 4, les fonctionnalités implémentées par HTML peuvent être réparties ainsi :

Structure générale d’un document HTML^[55]: Au plus haut niveau, un document HTML est séparé entre unen-tête et un corps. L’en-tête contient les informations sur le document, notamment son titre et éventuellement desmétadonnées. Le corps contient ce qui est affiché.
Informations sur la langue^[56]: Il est possible d’indiquer la langue de n’importe quelle partie du document et de gérer lemélange de texte s’écrivant de gauche à droite avec du texte de droite à gauche.
Marquage sémantique^[57]: HTML permet de différencier des contenus spécifiques tels que les citations d’œuvres externes (CITE), les extraits de code informatique (CODE), les passages en emphase (EM) et les abréviations (ABBR). Certains de ces éléments, conçus initialement pour permettre le support de documentations techniques, sont très rarement employés (différenciation entre les éléments devariable (VAR) et d’exemple (SAMP) de valeur dans un code informatique, par exemple, ou encore instance d’un terme défini dans le contexte (DFN)).
Listes^[58]: HTML différencie deslistes non ordonnées et deslistes ordonnées, selon que l’ordre formel du contenu dans le code est en soi ou non une information. Deslistes de définition existent également, mais sans que leur champ d’application ne soit exactement déterminé.
Tables^[59]: Cette fonctionnalité sert formellement à la présentation de données tabulaires, mais a été surtout exploitée pour ses capacités de mise en page avant que lesfeuilles de style en cascade (CSS) atteignent un degré de maturité suffisant.
Hyperliens^[60]: La fonctionnalité première de HTML.
Inclusion d’images, d’applets et d’objets divers^[61]: À l’origine, HTML permettait seulement de donner des hyperliens sur les médias externes. L’invention d’éléments spécialisés pour le multimédia a permis l’inclusion automatique d’image, de musique, de vidéo, etc. dans les pages web.
Éléments de regroupement [62] sans valeur sémantique: Ne conférant pas de signification au contenu qu’ils balisent, les éléments génériquesDIV etSPAN permettent d’appliquer des styles de présentation, de réaliser des traitements via des scripts ou tout autre opération nécessitant d’isoler une partie du contenu.
Style de la présentation^[63]: Chaque élément, voire tout le document, peut se voir appliquer des styles. Les styles sont définis dans le document ou proviennent defeuilles de style en cascade (CSS) externes.
Marquage de présentation du texte^[64]: Développé avant la généralisation de CSS pour fournir rapidement des fonctionnalités aux graphistes. D’usage désormais officiellement déconseillé pour la plus grande partie.
Cadres^[65]: Aussi connu sous le nom deframes, une fonctionnalité souvent décriée qui permet d’afficher plusieurs documents HTML dans une même fenêtre.
Formulaire pour l’insertion interactive de données^[66]: Les éléments de formulaire permettent aux visiteurs d'entrer du texte et des fichiers dans les pages Web.
Scripts^[67]: Permet d’associer des morceaux de programmes aux actions des utilisateurs sur le document. Les langages utilisés sont généralementJavaScript etVBScript.

Attributs de HTML

[modifier |modifier le code]

Les attributs permettent de préciser les propriétés des éléments HTML. Il y a 188 attributs dans laversion 4 de HTML^[68].

Certains attributs s’appliquent à presque tous les éléments :

les attributs génériquesid (identificateur unique) etclass (identificateur répétable)^[69] destinés à permettre l’application de traitements externes, tels que l’application de styles de présentation ou de manipulation de l’arbre du document via unlangage de script. Il s’y ajoute l’attributstyle^[70] permettant de définir le style de présentation de l’élément (généralement enCSS), et l’attributtitle^[71] apportant une information complémentaire de nature le plus souvent libre (L’exception majeure est l’utilisation dutitle pour déterminer le style permanent et les éventuels styles alternatifs appliqués à un document via des élémentslink) ;
les attributs d’internationalisationdir etlang^[56] spécifiant la direction d’écriture et la langue du contenu ;
les gestionnaires d’évènementsonclick,ondblclick,onkeydown,onkeypress,onkeyup,onmousedown,onmousemove,onmouseout,onmouseover,onmouseup^[72], qui capturent les évènements générés dans l’élément pour appeler un script.

D’autres attributs sont propres à un élément unique, ou des éléments similaires. Par exemple :

les éléments qui permettent d’inclure dans le document des ressources graphiques sont dotés d’attributs de hauteur et de largeur, afin que le navigateur puisse anticiper la taille de la ressource à afficher avant que celle-ci n’ait été téléchargée :img,object,iframe ;
des éléments spécifiques sont dotés d’un attribut assumant une fonction unique, tel que l’élémentlabel des étiquettes des contrôles de formulaire et son attributfor désignant le contrôle concerné : c’est, en HTML, et avec les attributsusemap etismap des images, l’une des très rares associations explicites et formalisées entre des éléments, indépendamment de leur ordre linéaire dans lecode source.

La plupart des attributs sont facultatifs. Quelques éléments ont cependant des attributs obligatoires :

de par leur nature : l’élémentimg est obligatoirement doté d’un attributsrc spécifiant l’URI de la ressource graphique qu’il représente. Il en est de même de tous les éléments dits « vides » et « remplacés »^[73] qui, au prix d’une entorse aux règlesSGML, n’ont pas de contenu propre. C’est également le cas d’éléments non vides pour des raisons fonctionnelles, comme l’élémentform dont l’attributaction indique la cible serveur qui traitera les données après soumission ;
pour des raisons liées à l’accessibilité du contenu : les images sont ainsi dotées d’un attribut obligatoirealt permettant d’indiquer un contenu textuel brut destiné à remplacer la ressource graphique dans les contextes de consultation où elle ne peut pas être restituée ou perçue.

Le type de contenu des attributs HTML échappe pour partie au champ d’application de cette norme, et sa validation relève de normes tierces telles que les URI, lestypes de contenu ou lescodes de langages.

Certains attributs sont enfin de type booléen. Ce sont les seuls attributs dont la syntaxe peut être validement implicite en HTML : l’attributselected d’un contrôle de formulaire peut ainsi être raccourci sous la formeselected remplaçant la forme complèteselected="selected". Cette forme particulière est un des points différenciant HTML de la syntaxe des documents « bien formés » au sens XML.

Jeux de caractères

[modifier |modifier le code]

Les pages Web peuvent être rédigées dans toutes sortes delangues et de très nombreuxcaractères peuvent être utilisés, ce qui requiert soit unjeu de caractères par type d’écriture, soit un jeu de caractères universel. Lors de l’apparition de HTML, le jeu de caractères universelUnicode n’était pas encore inventé, et de nombreux jeux de caractères se côtoyaient, notammentISO-8859-1 pour l’alphabet latin et ouest-européen,Shift-JIS pour lejaponais,KOI8-R pour lecyrillique. Aujourd’hui, le codageUTF-8 deUnicode est le plus répandu.

Leprotocole de communication HTTP transmet le nom du jeu de caractères. L’en-tête HTML peut comporter le rappel de ce jeu de caractères, qui devrait être identique, sauf erreur de réglage. Enfin, à la suite d'un mauvais réglage, le jeu de caractères réellement utilisé peut encore différer du jeu annoncé. Ces mauvais réglages causent généralement des erreurs d’affichage du texte, notamment pour les caractères non couverts par la normeASCII.

Technique d'échappement

[modifier |modifier le code]

Article détaillé :Liste des entités de caractère de XML et HTML.

Avant la généralisation d'Unicode, des entités SGML ont été définies pour représenter certains caractères nonASCII, ce qui revient en pratique à utiliser le caractère « & » commecaractère d'échappement. Cela a commencé avec les caractères d'ISO 8859-1 dans la normeHTML 2.0. Pour les diacritiques, ces entités suivent un principe simple : la lettre est suivie de l'abréviation de la diacritique associée.

Diacritiques d'ISO 8859-1
caractère	référence d'entité	remarque
Á	`Á`	`acute` pour l'accent aigu
Â	`Â`	`circ` pour l'accent circonflexe
À	`À`	`grave` pour l'accent grave
Å	`Å`	`ring` pour lerond en chef
Ã	`Ã`	`tilde` pour letilde
Ä	`Ä`	`uml` (Umlaute) pour letréma
Ç	`Ç`	`cedil` pour lacédille
Ø	`Ø`	`slash` pour labarre oblique

Le caractère « & » lui-même est représenté par&.

Interopérabilité de HTML

[modifier |modifier le code]

Tel qu’il a été formalisé par leW3C, HTML est conçu pour optimiser l’interopérabilité des documents. Le HTML ne sert pas à décrire le rendu final despages web. En particulier, contrairement à lapublication assistée par ordinateur, HTML n’est pas conçu pour spécifier l’apparence visuelle des documents. HTML est plutôt conçu pour donner dusens aux différentes parties du texte : titre, liste, passage important, citation, etc. Le langage HTML a été développé avec l’intuition que les appareils de toutes sortes seraient utilisés pour consulter le web : les ordinateurs personnels avec des écrans de résolution et de profondeur de couleurs variables, les téléphones portables, les appareils de synthèse et de reconnaissance de la parole, les ordinateurs avec une bande passante faible comme élevée, et ainsi de suite.

Comme HTML ne s’attache pas au rendu final du document, un même document HTML peut être consulté à l’aide de matériels et logiciels très divers. Au niveau matériel, un document peut notamment être affiché sur unécran d'ordinateur enmode graphique ou unterminal informatique enmode texte, il peut être imprimé, ou il peut être prononcé parsynthèse vocale. Au niveau logiciel, HTML ne fait pas non plus de supposition, et plusieurs types de logiciels lisent le HTML :navigateur web,robot d'indexation, scripts divers (enPerl,PHP) de traitement automatique.

Un haut degré d’interopérabilité permet de baisser les coûts des fournisseurs de contenus car une seule version de chaque document sert des besoins très variés. Pour l’utilisateur du web, l’interopérabilité permet l’existence de nombreux navigateurs concurrents, tous capables de consulter l’ensemble du web.

Chaque version de HTML a essayé de refléter le plus grand consensus entre les acteurs de l’industrie, de sorte que les investissements consentis par les fournisseurs de contenus ne soient pas gaspillés et que leurs documents ne deviennent en peu de temps illisibles. La séparation du fond et de la forme n’a pas toujours été respectée au cours du développement du langage, comme en témoigne par exemple le balisage de style de texte, qui permet d’indiquer notamment la police de caractères souhaitée pour l’affichage, sa taille, ou sa couleur.

Notes et références

[modifier |modifier le code]

↑Par exemple dans la recommandation HTML 3.2

↑Raggettet al. 1998,p. 14.
↑« ISO/IEC 15445:2000 », surISO(consulté le7 octobre 2020).
↑(en)Request for comments n^o 1866
↑(en)Tim Berners-Lee, « Re: Qualifiers on Hypertext links... », surnews:alt.hypertext,6 août 1991
↑(en)Tim Berners-Lee, Mark Fischetti,Weaving the web: the past, present and future of the World Wide Web by its inventor,Londres, Texere,2000,p. 45-46(ISBN 978-1-58799-018-2).
↑Raggettet al. 1998,p. 21.
↑a etb(en) James Gillies,Robert Cailliau,How the Web was Born: The Story of the World Wide Web,Oxford,Oxford University Press,2000,p. 212-213(ISBN 978-0-19-286207-5).
↑(en)Hypertext Markup Language (HTML),Internet Draft,juin 1993, sur w3.org.
↑(en) « Introduction to HTML 4 », surwww.w3.org(consulté le7 octobre 2020)
↑« Introduction à HTML 4 », surwww.la-grange.net(consulté le7 octobre 2020)
↑(en) Marc Andreessen et Eric Bina, « NCSA Mosaic for X 0.10 released », surWWW-talk,14 mars 1993
↑Marc Andreessen, créateur deNetscape Navigator, déclarait dès 1993 sur la liste de discussion www-talk :« Je pense que s’occuper duSGML en général est une complète perte de temps, et que nous en serions aujourd’hui beaucoup plus loin si nous n’étions pas encombrés avec cet héritage SGML que nous continuons à porter. 99,99 % des gens avec qui je parle veulent mettre en ligne des documents riches, veulent contrôler leur apparence, et se contre-fichent totalement du balisage sémantique ou des différences entre la structure et le rendu d’un document. »(en)HTML Spec, daté du16 juin 1993.
↑(en) « Introduction to HTML 3.0 », surW3C
↑(en) « Hypertext Markup Language - 2.0 »,Request for commentsn^o 1866
↑(en) « HTML 3.2 Reference Specification », surwww.w3.org(consulté le8 octobre 2020)
↑La W3C a lancé en 1997 les premiers travaux de son (en) Initiative pour l’Accessibilité du web (WAI), qui entame alors l’élaboration de ce qui allait devenir les premières (en) Directives pour l’Accessibilité des Contenus web (WCAG), essentiellement consacrées à l’accessibilité des documents HTML.
↑(en) « Extensible Markup Language (XML) 1.0 »,10 février 1998
↑(en) « XHTML™ 1.0: The Extensible HyperText Markup Language : A Reformulation of HTML 4 in XML 1.0 »,26 janvier 2000
↑L’initiative vient d’Opera et de Mozilla, rejoints par la suite parApple,(en)http://www.w3.org/2004/04/webapps-cdf-ws/papers/opera.html.
↑(en) Jeffrey Zeldman,An angry fix, mis en ligne le17 juillet 2006.
↑« Le XHTML a été appliqué sur d’autres marchés, dont les périphériques mobiles, les applications d’entreprise, les applications serveurs, ainsi que dans un nombre croissant d’applications web telles que les blogiciels. Par exemple, le Groupe de travail des Meilleures Pratiques du web Mobile a inclus le standardXHTML Basic comme pierre angulaire des Meilleures Pratiques du web Mobile car les logiciels s’exécutant avec peu de mémoire peuvent le prendre en charge. … Avec la mise en place du Groupe de travailXHTML 2, leW3C continuera son travail technique sur le langage et prendra parallèlement en compte la revalorisation de la technologie afin d’expliquer clairement son indépendance et sa valeur sur le marché … »,(en)Communiqué du W3C,7 mars 2007.
↑« 2009 - W3C », surwww.w3.org(consulté le8 octobre 2020).
↑(en) « XHTML™ 2.0 publication history »
↑Tim Berners Lee écrivait dèsoctobre 2006 :« la tentative de faire passer tout le monde à XML et aux contraintes syntaxiques que cela impose (guillemets autour des valeurs d’attributs, barre oblique dans les balises simples et espaces de noms), à intégrer d’un seul coup, n’a pas fonctionné … Il faut créer un groupe de travail HTML entièrement nouveau qui, contrairement au précédent, sera destiné à apporter des améliorations incrémentales à HTML, ainsi qu’à XHTML »,(en)http://dig.csail.mit.edu/breadcrumbs/node/166.
↑(en) « HTML Working Group », Charte du groupe de travail HTML W3C, surwww.w3.org(consulté le7 octobre 2020)
↑(en)Results of Questionnaire Shall we Adopt HTML5 as our specification text for review?, sur w3.org.
↑(en)HTML 5 – A vocabulary and associated APIs for HTML and XHTML – W3C Working Draft 22 January 2008,http://www.w3.org/TR/html5/.
↑(en)HTML Design Principles, sur w3.org.
↑(en) « HTML5 : A vocabulary and associated APIs for HTML and XHTML »,28 octobre 2014
↑(en) « HTML 5.1 »,1^er novembre 2016
↑(en) « HTML 5.1 2nd Edition »,3 octobre 2017
↑(en) « HTML 5.2 »,14 décembre 2017
↑(en) « HTML 3.2 Reference Specification publication history »
↑(en) « HTML 4.0 Recommendation publication history »
↑(en) « HTML 4.01 Specification publication history »
↑(en) « HTML5 publication history »
↑(en) « XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition) publication history »
↑(en) « XHTML™ 1.1 - Module-based XHTML - Second Edition publication history »
↑(en) « HTML 5.2 publication history »
↑(en) « HTML 5.3 publication history »
↑Denis Christine, « Historique d'Internet », surwebpao.inaden.org,2018(consulté le8 octobre 2020)
↑^{a etb}« HTML Standard », surhtml.spec.whatwg.org(consulté le8 octobre 2020)
↑(en) « W3C and WHATWG to work together to advance the open Web platform »,28 mai 2019
↑(en) Henri Sivonen,An HTML5 Conformance Checker, thèse de Master, Helsinki, 2007.
↑Comme la forme courte<em/emphase/> au lieu de<em>emphase</em>.
↑(en) « Internet Protocol »,Request for commentsn^o 791
↑Comme valideur HTML, on peut notamment citer le(en)Markup Validation Service du W3C.
↑« Paragraphs, Lines, and Phrases », surwww.w3.org(consulté le8 octobre 2020)
↑(en) « The XML syntax : Writing documents in the XML syntax », surHTML Living Standard(consulté le18 novembre 2024)
↑« [Valid] Markup Validation of upload://Form Submission - W3C Markup Validator », survalidator.w3.org(consulté le8 octobre 2020)
↑Tim Berners-Lee considérait les balises de titre, et même de liste, comme des balises de style. Voir notamment la présentationLes standards HTML et CSS des origines à mercredi dernier de Daniel Glazman.
↑Des navigateurs commeNetscape Navigator 4 ont eu du mal à faire cette transition ; ainsi un style appliqué à l’élémentp donnait des résultats dépendants de la présence de la balise optionnelle de fermeture</p>.
↑Pour simplifier SGML, le standard XML (sur lequel est basé XHTML) n’autorise pas les balises optionnelles.
↑(en) « Index of Elements », surW3C,1999
↑(en)HTML 4.01 Specification - 7 The global structure of an HTML document, sur www.w3.org (consulté le9 octobre 2020) ;7 La structure globale du document HTML, sur www.la-grange.net (consulté le9 octobre 2020)
↑^{a etb}(en)HTML 4.01 Specification - 8 Language information and text direction, sur www.w3.org (consulté le9 octobre 2020) ;8 Les indications de langue et la direction du texte, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 9 Text, sur www.w3.org (consulté le9 octobre 2020) ;9 Le texte, sur www.la-grange.net (consulté le9 octobre 2020)
↑(en)HTML 4.01 Specification - 10 Lists sur www.w3.org (consulté le9 octobre 2020) ;10 Les listes, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 11 Tables sur www.w3.org (consulté le9 octobre 2020) ;11 Les tables, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 12 Links sur www.w3.org (consulté le9 octobre 2020) ;12 Les liens, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 13 Objects, Images, and Applets sur www.w3.org (consulté le9 octobre 2020) ;13 Les objets, les images et les applets, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 7.5.4 Grouping elements: the DIV and SPAN elements, sur www.w3.org (consulté le9 octobre 2020) ;7.5.4 Le regroupement des éléments : les éléments DIV et SPAN, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 14 Style Sheets, sur www.w3.org (consulté le9 octobre 2020) ;14 Les feuilles de style, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 15 Alignment, font styles, and horizontal rules, sur www.w3.org (consulté le9 octobre 2020) ;15 L’alignement, les styles de police et les règles horizontales, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 16 Frames, sur www.w3.org (consulté le9 octobre 2020) ;16 Les cadres, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 17 Forms, sur www.w3.org (consulté le9 octobre 2020) ;17 Les formulaires sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 18 Scripts, sur www.w3.org (consulté le9 octobre 2020) ;18 Les scripts, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - Index of Attributes sur www.w3.org (consulté le9 octobre 2020) ;Index des attributs, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 7.5.2 Element identifiers: the id and class attributes, sur www.w3.org (consulté le9 octobre 2020) ;7.5.2 Les identifiants des éléments : les attributs id et class, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 14.2.2 Inline style information, sur www.w3.org (consulté le9 octobre 2020) ;14.2.2 Les informations de style en-ligne, sur www.la-grange.net (consulté le9 octobre 2020).
↑(en)HTML 4.01 Specification - 7.4.3 The title attribute sur www.w3.org (consulté le9 octobre 2020) ;7.4.3 L’attribut title, sur www.la-grange.net (consulté le9 octobre 2020)
↑(en)HTML 4.01 Specification - 18.2.3 Intrinsic events sur www.w3.org (consulté le9 octobre 2020) ;18.2.3 Les événements intrinsèques, sur www.la-grange.net (consulté le9 octobre 2020)
↑au sens deCSS 2.1 qui explicite la notion d’« élément remplacé » restée implicite en HTML. Voir(en)http://www.w3.org/TR/CSS21/conform.html#replaced-element.

Bibliographie

[modifier |modifier le code]

(en) DaveRaggett, JennyLam, IanAlexander et MichaelKmiec,Raggett on HTML 4, Addison-Wesley,1998(ISBN 0-201-17805-2).

Voir aussi

[modifier |modifier le code]

Sur les autres projets Wikimedia :

HTML, surWikimedia Commons
HTML,sur leWiktionnaire
Hypertext Markup Language,surWikiversity
Hypertext Markup Language,surWikibooks

Articles connexes

[modifier |modifier le code]

World Wide Web
World Wide Web Consortium (W3C)
Élément HTML
CSS
JavaScript
Extensible Hypertext Markup Language (XHTML)
HTML5
RDFa
Standard Generalized Markup Language (SGML)
JHTML

Liens externes

[modifier |modifier le code]

(en) Site officiel
Notices dans des dictionnaires ou encyclopédies généralistes :
Notices d'autorité :
- BnF (données)
- LCCN
- GND
- Espagne
- Israël
- Tchéquie
(en)HTML 2.0 Materials, liens et informations sur HTML jusqu'à la version 2.0
(en)The W3c Markup Validation Service

Documents officiels

[modifier |modifier le code]

(en)Hypertext Markup Language - 2.0Request for Comments 1866, Tim Berners-Lee, MIT/W3C, Dan Conolly, novembre 1995
(en)HTML 3.2 Reference Specification, ancienne recommandation du W3C,14 janvier 1997
(en)HTML 4.01 Specification, ancienne recommandation du W3C,24 décembre 1999
- La spécificationHTML 4.01, traduction française non normative
(en)HTML 5.2, ancienne recommandation du W3C, 14 décembre 2017
(en)HTML Living Standard specifications, successeur du HTML5, qui n'a plus de version numérotée.

v ·m Couches du modèle OSI
7.Application	AMQP BGP DHCP DNS FTP FTPS SFTP FXP Gemini Gopher H.323 HTTP HTTPS IMAP IPP IRC LDAP LMTP MODBUS MQTT NFS NNTP POP RDP RTSP SILC SIMPLE SIP SMB-CIFS SMTP SNMP SOAP SSH TCAP Telnet TFTP VoIP WebDAV XMPP
6.Présentation	AFP ASCII ASN.1 HTML MIME NCP TDI TLS TLV Unicode UUCP Vidéotex XDR XML
5.Session	AppleTalk DTLS NetBIOS RPC RSerPool SOCKS
4.Transport	DCCP QUIC RSVP RTP SCTP SPX TCP UDP
3.Réseau	ARP Babel BOOTP CLNP ICMP IGMP IPv4 IPv6 IPX IS-IS NetBEUI NDP RIP EIGRP OSPF RARP X.25
2.Liaison	Anneau à jeton (token ring) Anneau à jeton adressé (Token Bus) ARINC 429 AFDX ATM Bitnet CAN Ethernet FDDI Frame Relay HDLC I²C IEEE 802.3ad (LACP) IEEE 802.1aq (SPB) LLC LocalTalk MIL-STD-1553 PPP STP Wi-Fi X.21
1.Physique	4B5B ADSL BHDn Bluetooth Câble coaxial Codage bipolaire CSMA/CA CSMA/CD DSSS E-carrier EIA-232 EIA-422 EIA-449 EIA-485 FHSS HomeRF IEEE 1394 (FireWire) IrDA ISDN Manchester Manchester différentiel Miller MLT-3 NRZ NRZI NRZM Paire torsadée PDH SDH SDSL SONET SPI T-carrier USB VDSL VDSL2 V.21-V.23 V.42-V.90 Wireless USB 10BASE-T 10BASE2 10BASE5 100BASE-TX 1000BASE-T
Articles connexes : Pile de protocoles Modèle Internet Couche 8

v ·m Accessibilité du web
Acteurs internationaux	Web Accessibility Initiative (W3C)
Standards	WCAG ATAG UAAG ARIA
Acteurs nationaux	WebAIM RNIB Accessiweb
Technologies compatibles	HTML XHTML HTML5 CSS JavaScript SMIL PDF Flash
Méthodes d'application	Section 508 RGAA Accessiweb Renow

Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Hypertext_Markup_Language&oldid=233441398 ».

Catégories :

Catégories cachées :

[8]ページ先頭

©2009-2026 Movatter.jp