Movatterモバイル変換


[0]ホーム

URL:


Aller au contenu
Wikipédial'encyclopédie libre
Rechercher

Langage de balisage

Un article de Wikipédia, l'encyclopédie libre.
Page d’aide sur l’homonymie

Pour les articles homonymes, voirBalise.

Eninformatique, leslangages de balisage représentent une classe delangages spécialisés dans l'enrichissement d'information textuelle. Ils utilisent desbalises, unités syntaxiques délimitant une séquence de caractères ou marquant une position précise à l'intérieur d'un flux de caractères (par exemple unfichier texte).

L'inclusion de balises permet de transférer à la fois lastructure du document et son contenu. Cette structure est compréhensible par unprogramme informatique, ce qui permet un traitement automatisé du contenu.

Éléments de syntaxe

[modifier |modifier le code]

La caractéristique principale des langages de balisage est d'utiliser des balises.

Le rôle des balises est de proposer une syntaxe pour délimiter une séquence de caractères ou pour marquer une position précise dans un flux de caractères.

Un exemple en langageLaTeX :

  • les balises\begin{document} et\end{document} délimitent le « document » ;
  • la balise\\ marque un retour à la ligne.

Selon les langages, les balises peuvent être différentes. En langage LaTeX, elles débutent par unebarre oblique inverse.

Dans les dérivés deXML, les balises marquent le début et la fin des « éléments ».

Elles sont formées de caractèresunicode encadrés par les signes< et>. Ainsi<table>,<vidéo> et<B#3> sont des balises syntaxiquement valides en XML.

Les balises marquant la fin des éléments comportent une barre oblique après leur signe inférieur (</table>).

Des balises vides existent également et sont notées par une barre oblique avant le signe supérieur (<br/>).

Selon les langages, d'autres spécificités syntaxiques des balises peuvent exister comme les attributs ou les options.

Utilisations

[modifier |modifier le code]

Les balises ne sont qu'une particularité syntaxique du langage. Les langages les utilisant peuvent donc être d'usage multiple, de la programmation à l'annotation de documents.

Langages de définition de documents

[modifier |modifier le code]

Historiquement, les langages à base de balises servent surtout à structurer ou formater des documents.

De par leur spécificité syntaxique d'utiliser des balises, ces langages facilitent l'annotation de texte.Il suffit en effet d'encadrer des portions de texte par des balises pour utiliser une fonctionnalité du langage.

Par exemple, en HTML, il suffit d'encadrer des mots par les balises<p> et</p> pour en faire un paragraphe.

Un simpleéditeur de texte suffit ainsi à définir un document.

En utilisant un éditeur de texte orientélangages de programmation, tel queNotepad++, la sauvegarde ducode source sous un nom de fichier muni de l'extension appropriée, lacoloration syntaxique sera activée. Ainsi, le texte sera présenté avec les balisesindentées et différenciées.

Parmi les langages de définition de documents les plus populaires on compteDocBook,LaTeX,HTML ou les dérivés deTEI.

Langages de description de types de documents

[modifier |modifier le code]

Ces langages particuliers servent à définir des classes de documents valides selon un certain nombre de critères. Or ces critères peuvent parfois être exprimés également à l'aide de balises.

Par exemple lesDTD permettent de définir des classes de documentsSGML ouXML. La DTD va imposer la structure des documents qui la respectent. Une DTD utilise des balises pour spécifier quels éléments et quels attributs sont autorisés.

Lesschémas XML sont un autre moyen de définir des classes de documents XML. Formant eux-mêmes une classe de documents XML, ils utilisent évidemment des balises XML.

Langages procéduraux

[modifier |modifier le code]

Dans ces langages, les balises intégrées dans le texte sont des instructions pour le programme qui va « lire » le texte.

Ainsi, le langageTeX contient des instructions de formatage de document sous forme de balises. Par exemple la balise\vsize permet de spécifier la hauteur de la page à afficher.

Autres utilisations

[modifier |modifier le code]

Avec l'essor de XML, les outils de traitement des documents XML ont considérablement évolué. Il a donc été naturel d'utiliser XML lui-même pour définir d'autres langages à base de XML. Cette façon de voir a donné naissance à de nombreux langages de balisage (car à base de XML) et d'usages très hétéroclites. Exemples d'usages :

Exemples importants

[modifier |modifier le code]

Langages SGML

[modifier |modifier le code]

Historiquement, les langages de balisage les plus utilisés sur leWeb sont des applications dérivées deSGML.

Langage HTML

[modifier |modifier le code]
Article détaillé :HTML.

Le langage de balisage le plus couramment utilisé sur leWorld Wide Web est leHTML. En HTML, on utilise des balises prédéfinies afin de préciser à l'intérieur d'un fichier texte des éléments tels que les titres, les paragraphes, lesacronymes, les citations, etc.

Les éléments de blocs et les éléments en-ligne
[modifier |modifier le code]

On distingue les balises définissant un bloc des balises en-ligne par :

  • le modèle de contenu : les éléments de bloc peuvent contenir à la fois des éléments de bloc, des éléments en-ligne et des données ; les éléments en-ligne ne peuvent contenir que des éléments en-ligne et des données. « L'idée inhérente à cette distinction structurelle, c'est que les éléments de bloc créent des structures “plus grandes” que les éléments en-ligne. »
  • le formatage : « par défaut, les éléments de bloc sont formatés différemment des éléments en-ligne. En général, les éléments de bloc commencent sur une nouvelle ligne tandis que les éléments en-ligne commencent sur la même ligne. »

« Les feuilles de style fournissent les moyens de spécifier la restitution d'éléments arbitraires, y compris si l'élément est rendu comme étant de type bloc ou de type en-ligne. »

L'ensemble des citations est tiré de la spécification dustandard HTML[2].

Exemple
[modifier |modifier le code]
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>

On délimite la phrase « Lorem ipsum dolor sit amet, consectetuer adipiscing elit. » par la balisep (définissant un paragraphe) au moyen d'une balise d'ouverture (<p>) et d'une balise de fermeture (</p>). Cette phrase est contenue dans l'élémentp, lui-même obligatoirement contenu dans l'élémentbody (cet élément définit le début du corps du fichier HTML).

Autres langages SGML

[modifier |modifier le code]

XML

[modifier |modifier le code]
Extrait d'un document XML.

LeXML pousse très loin la description sémantique d'un fichier, permettant de délimiter avec précision, par exemple dans une recette, les<ingrédients>, le<temps-de-cuisson>, les<plats-nécessaires>, etc. Afin d'exploiter un document XML écrit de cette façon, on utilise des feuillesXSLT permettant de transformer un document XML en un autre type de document XML.

Toutefois, cette liberté dans le choix des balises permet à un fichier d'être écrit en XML sans pour autant délimiter des informations sémantiques : hors-contexte, la balise<hy> ne signifie rien, à moins de définir sa signification à l'intérieur d'un fichier de définition, appeléDTD, associé au fichier XML.

Microsoft etThe Document Foundation utilisent un format XML pour certains formats de fichierbureautique. Par exemple le suffixe .odt deLibreOffice cache une arborescence de fichiers XMLzippés.

Tous les langages dérivés de XML, appelés dialectes XML, sont des langages de balisage.

Notes et références

[modifier |modifier le code]
  1. (en)« XSP Logicsheet Guide », guide à l'utilisation de XSP.
  2. Traduction non officielle de la recommandation.

Voir aussi

[modifier |modifier le code]

Sur les autres projets Wikimedia :

Articles connexes

[modifier |modifier le code]

Liens externes

[modifier |modifier le code]

Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Langage_de_balisage&oldid=220593703 ».
Catégories :
Catégories cachées :

[8]ページ先頭

©2009-2025 Movatter.jp