Movatterモバイル変換

Aller au contenu

Uniform Resource Locator

Modifier les liens

Un article de Wikipédia, l'encyclopédie libre.

URL

Page d’aide sur les redirections

« URL » redirige ici. Pour les autres significations, voirURL (homonymie).

Uniform Resource Locator

L'adresse web de la présente page, affichée dans labarre d'adresse dunavigateur web Mozilla Firefox.

Type	Identifiant uniforme de ressource

modifier -modifier le code -modifier Wikidata

Une^[1]^,^[2]^,^[3] ou un^[3]URL (sigle de l'anglais :Uniform Resource Locator, littéralement « localisateur uniforme de ressource »), informellement appeléeadresse web, est unechaîne de caractères qui indique sous une forme standardisée comment accéder à uneressource duWorld Wide Web à traversInternet. Les URL commencent par unprotocole Internet suivi du caractèredeux-points ; la suite est souvent constituée d'unnom de domaine et d'unchemin d'accès.

Conceptuellement, une URL donne la localisation d'une ressource, sans garantir que la ressource s'y trouve, d'où le risque delien mort. Il existe un autre type de chaîne qui identifient des ressources indépendamment de leur localisation,Uniform Resource Name (URN). URL et URN sont chacune un sous-ensemble des identifiants uniformes de ressource (Uniform Resource Identifier, URI). Tous ces identifiants sont standardisés parRequest for comments (RFC), dont leRFC 3986 [4].

Définition et dénomination

[modifier |modifier le code]

Dans les cercles techniques, les adresses web ont été connues sous divers noms : adresse WWW,Universal Document Identifier,Universal Resource Identifiers (RFC 1630 [5]), et finalement divisées enUniform Resource Locators (URL,RFC 1738 [6],RFC 1808 [7]) etUniform Resource Names (URN,RFC 1737 [8]), le tout étant desUniform Resource Identifiers (URI,RFC 2396 [9],RFC 3986 [4])^[10]. L'abréviation URL est utilisée dans le standardHTML 3.2^[11], et elle est devenue la plus connue et utilisée par les techniciens. La situation est devenue suffisamment confuse pour que leRFC 3305 [12] soit écrit pour clarifier la terminologie.

Le nom original que l'inventeur du web donne aux adresses web estUniversal Document Identifier (UDI)^[13]. L'été1992, il propose à l'Internet Engineering Task Force (IETF) de standardiser ces UDI, mais la dénomination « universel » a été écartée car jugée trop « arrogante » pour un projet alors jeune comme le Web. La dénominationUniform Resource Identifier (URI) est le compromis résultant.

Lors de la standardisation des URI, il était clair qu'en pratique, les adresses web n'identifiaient pas des documents, mais des emplacements de documents. Autrement dit, si un document est déplacé, alors son adresse change. En pratique, lorsqu'une ressource est déplacée, tous les hyperliens qui y mènent sont brisés, ce qui donne l'erreur HTTP 404 sur unserveur HTTP.

Devant cet état de fait, il a été décidé que les adresses web seraient appeléesUniform Resource Locator (URL). L'idée était de standardiser deux sortes d'URI : Les URL seraient les URI qui indiquent « comment » (par quel chemin sur le réseau) accéder à une ressource, sa localisation ; les Uniform Resource Names (URN) seraient les URI qui identifient les documents eux-mêmes, indépendamment de leur localisation.

Tim Berners-Lee ne cessait cependant pas d'insister pour que, au moins en théorie, les adresses web soient conçues pour être universelles. Il trouvait aussi que l'IETF perdait son temps en discussions, aussi enjuin 1994 il publie leRFC 1630 [5],Universal Resource Identifiers in WWW. Ce premierrequest for comments sur les adresses web est de la catégorie informative. Il décrit simplement la pratique de l'époque, et contient quelques erreurs.

Francisation

[modifier |modifier le code]

Diversesfrancisations ont été proposées par des organismes nationaux. LeVocabulaire de l'informatique et de l'internet publié auJournal officiel du16 mars 1999 par laCommission générale de terminologie et de néologie deFrance^[14] a proposé « adresse réticulaire » et « adresse universelle ». Ces deux dénominations ont été rejetées par l'Office québécois de la langue française à cause de leur manque de précision, et elles ne sont pas entrées dans l'usage courant.

L'Office québécois de la langue française propose^[15], « adresse URL », « URL », « adresse web » et « adresse W3 ». Il fait remarquer que « adresse web » ne s'utilise généralement que pour les ressources dessites web, alors que l'abréviation URL met l'accent sur l'universalité de ces adresses, qui peuvent identifier des forumsUsenet, des sitesFTP, etc. Le grand public confond aussi souvent adresse web,adresse électronique etadresse IP.

Pour éviter toutes ces ambiguïtés, les professionnels du web utilisent souvent l'abréviation « URL », bien qu'ils fassent en fait référence aux URI^[16].

Usages

[modifier |modifier le code]

Dans les navigateurs web

[modifier |modifier le code]

Lorsqu'on navigue sur leWeb, lenavigateur web affiche l'URL de la ressource consultée dans labarre d'adresse. Si l'on veut consulter une ressource dont on connaît l'URL, on peut directement la taper dans cette barre.

Dans les premières années du Web, les navigateurs web n'acceptaient que des adresses techniquement valides pour identifier les ressources. Mais à la suite du développement du Web, leprotocole de communication HTTP s'est imposé pour transmettre l'immense majorité des ressources consultées. Ainsi jusque dans les années 2010 les URL depage web commençaient presque toujours parhttp://, puishttps:// dans les années suivantes. Les navigateurs web ont donc évolué pour permettre l'omission de ces caractères lors d'une saisie dans leur barre d'adresse.

Plus récemment, certains navigateurs commeGoogle Chrome n'affichent plus l'URL complète dans la barre d'adresse. Le protocole ou le préfixe « www » peuvent être masqués^[17]^,^[18].

Historique de navigation

[modifier |modifier le code]

Les navigateurs web conservent un historique des URL consultées. Cela leur permet de reconnaître et présenter de manière distinctive les hyperliens vers des ressources déjà consultées.

Pages favorites

[modifier |modifier le code]

Il suffit à un navigateur web de conserver l'URL d'une ressource pour constituer une liste de favoris (oumarque-pages). Lorsqu'un titre de ressource existe, les navigateurs le conservent aussi, ce qui permet d'afficher le titre d'une page plutôt que son URL.

Dans les pages web

[modifier |modifier le code]

En HTML, le langage conçu pour écrire les pages web, on trouve de nombreuses URL. Chaque hyperlien est techniquement constitué d'une URL, invisible mais utilisée par le navigateur, et du texte (parfois d'une image) constituant la partie visible de l'hyperlien. Les URL sont aussi utilisées pour indiquer au navigateur la localisation de chaque ressource annexe incluse dans la page : images, vidéos, programmes informatiques, etc.

Dans la vie courante

[modifier |modifier le code]

Des adresses web sont souvent données dans la publicité, ou indiquées sur les produits. Les adresses faciles à retenir sont alors recherchées. Ces adresses sont destinées à être saisies dans la barre d'adresse d'un navigateur, donc lehttp:// du protocole peut être omis. L'adresse web se résume alors à un simplenom de domaine, commewww.example.com. Ce nom est apparu tellement important dans la communication de certainesentreprises, que durant labulle Internet, elles ont utilisé l'adresse de leur site web en tant que nom commercial (Amazon.com, etc.).

D'autre part, une activité économique spécialisée s'est constituée pour acheter les noms de domaine reposant sur des mots courants, susceptibles d'être fréquemment recherchés par des Internautes. En règle générale, les domaines terminant par.com ont une valeur plus élevée que ceux terminant par des extensions nationales, en.fr par exemple. Dans d'autres cas, les noms de domaine composés de mots appartenant à certains champs lexicaux spécifiques voient leur valeur décuplée par une association avec des extensions particulières. En effet, à titre d'exemple,.io est largement associée à l'univers des nouvelles technologies. Afin de donner un ordre de grandeur, en octobre 2022, le prix du nom de domainesex.online dépassait le million d'euros.

Légalement plus trouble, letyposquatting consiste à acheter sans autorisation des domaines dont le nom s'apparente à des marques connues appartenant à des tiers, parfois en remplaçant un caractère par un caractère visuellement très similaire d'un autre alphabet.

Lecybersquattage consiste à acheter un nom de domaine portant un nom appartenant à une tierce partie, pour le lui revendre chèrement. C'est illégal dans de nombreux pays.

Escroquerie de type hameçonnage

[modifier |modifier le code]

L'escroquerie appeléehameçonnage consiste à envoyer à une victime une URL qui ressemble à celle d'un site web légitime, comme celui de sa banque, alors qu'en fait il s'agit de l'URL d'un site conçu pour extorquer des informations confidentielles, comme les codes d'accès au compte bancaire.

Conception

[modifier |modifier le code]

Les trois inventions à la base duWorld Wide Web sont :

les adresses Web
leprotocole de communicationHypertext Transfer Protocol (HTTP)
lelangage de balisageHyperText Markup Language (HTML)

Bien qu'un protocole (HTTP) et unformat de données (HTML) aient été développés spécifiquement pour le Web, le web est conçu pour imposer un minimum de contraintes techniques^[19]. En particulier, d'autres formats et protocoles que HTML et HTTP peuvent être utilisés. Cependant, pour qu'une ressource puisse faire partie du Web, elle doit être exprimable sous la forme d'une adresse web. C'est en ce sens que les adresses sont l'invention la plus fondamentale.

Syntaxe

[modifier |modifier le code]

Lasyntaxe générale des URL est la suivante :

protocole:partie_spécifique

Une URL est unechaîne de caractères combinant les informations nécessaires pour indiquer à unlogiciel comment accéder à une ressourceInternet. Ces informations peuvent notamment comprendre leprotocole de communication, un nom d'utilisateur, un mot de passe, uneadresse IP ou unnom de domaine, unnuméro de port TCP/IP, un chemin d'accès, une requête.

Les informations nécessaires varient selon la ressource et le contexte d'utilisation de l'URL. En outre unidentificateur de fragment peut être ajouté à la fin d'une URL pour identifier un élément à l'intérieur de la ressource. Bien que l'identificateur de fragment ne fasse pas formellement partie de l'URL, il est également décrit dans cet article et dans les standards techniques.

URL absolue de type hiérarchique

[modifier |modifier le code]

De nombreux protocoles (HTTP, FTP) ont une forme d'adresse dite hiérarchique.

nom des composants	protocole	:	//	nom	:	mot de passe	@	hôte	:	port	chemin d'accès	?	requête	#	fragment
URL	http://Jojo:lApIn@www.example.com:8888/chemin/d/acc%C3%A8s.php?q=req&q2=req2#signet
valeur des composants	http	:	//	Jojo	:	lApIn	@	www.example.com	:	8888	/chemin/d/acc%C3%A8s.php	?	q=req&q2=req2	#	signet

Une URL absolue permet d'indiquer comment accéder à une ressource indépendamment de tout contexte où elle peut être précisée ou transmise. Elle commence par l'indication d'un schéma de représentation (spécifique au protocole de communication utilisé pour accéder à cette ressource), suivi de l'ensemble des paramètres permettant de localiser sur le réseau le service hébergeant la ressource, puis permet de préciser à ce service le nom d'une ressource à traiter, transmettre des données de traitement, acheminer et récupérer les résultats, puis de préciser éventuellement quelle partie de ce résultat sera utilisée.

Exemple :http://Jojo:lApIn@www.example.com:8888/chemin/d/acc%C3%A8s.php?q=req&q2=req2#signet

Protocole, normalement obligatoire (mais certains clients web peuvent tenter de déterminer le protocole à partir de la forme du nom du service codé ci-dessous) :
- http :protocole de communication, en l’occurrence iciHTTP, pour accéder à unserveur web,
- : : caractère de séparation obligatoire si le protocole est précisé.
Localisation complète de la ressource, représentée selon le protocole de représentation ci-dessus :
- emplacement du service hébergeant la ressource sur l’espace du réseau global :
  - // : chaîne de caractères pour lesprotocoles dont la requête comprend un chemin d'accès, permettant de préciser et localiser le service avant ce chemin,
  - données d’authentification (optionnelles, le service peut les demander séparément de façon plus sécurisée que via l’URL). Le nom, le mot de passe et le numéro de port sont rarement utilisés. En plus les attaques d'hameçonnage peuvent tirer parti de cette syntaxe pour masquer un nom de domaine illégitime sous l'apparence d'un nom légitime. Les navigateurs ont retiré le support des données d’authentification :
    - Jojo : nom d’utilisateur, notamment utile pour accéder à des parties non publiques d'unsite web,
    - : : caractère de séparation si un mot de passe est indiqué,
    - lApIn : mot de passe de l'utilisateur, indiqué ici « en clair »,
    - @ : caractère terminant les données d'identification présentes avant le nom du service.
  - www.exemple.com :nom de domaine du service ; on peut parfois utiliser plutôt sonadresse IP. Si le nom de service ou l’adresse peuvent contenir des caractères réservés comme:, le nom de service ou l'adresse sera encadré de crochets doubles[[ ]]. Lui-même se décompose en:
    - www: sous-domaine (par défautwww),
    - exemple : nom de domaine dedeuxième niveau,
    - com : nom dedomaine de premier niveau,
  - indication optionnelle d’un numéro de port (au cas où le même serveur possède des services n’utilisant pas le port par défaut pour le protocole de communication) :
    - : : caractère indiquant qu’un numéro de port est précisé en suffixe,
    - 8888 : numéro deport TCP/IP duserveur HTTP, doit être précisé lorsqu’il ne s’agit pas duport standard pour le protocole utilisé (qui est 80 pourHTTP, 21 pourFTP…),
    - [2001:db8::1234]:8888 : Dans le cas d'une adresse IPv6, si on veut spécifier le port, il est obligatoire de mettre l'adresse entre crochets pour ne pas confondre le port et l'adresse.
- Nom complet de la ressource à demander sur le service une fois connecté :
  - /chemin/d/ : chemin absolu (commençant par un/) sur le service contenant lapage web, obligatoire pour les services à chemin d’accès (par défaut ce chemin sera/),
  - acc%C3%A8s.php : nom de la page web, optionnel (de nombreuxservices web déterminent un nom de ressource par défaut pour chaque chemin indiqué). On remarque qu’un caractère nonASCII comme « è » est codé en « %C3%A8 »^[20]. L'extension n'a aucune signification directe pour le client, mais en revêt parfois pour le serveur qui l’utilise localement pour savoir comment traiter la ressource demandée et la présenter au client.
- Données supplémentaires optionnelles, transmises au service lors de la demande à la ressource :
  - ? : caractère de séparation obligatoire pour indiquer que des données complémentaires suivent.
  - q=req&q2=req2 - chaîne de requête, traitée par la page web sur leserveur.
Données supplémentaires optionnelles, pour l’exploitation de la ressource après son obtention par le logiciel client (non transmises dans la requête au service) :
- # : caractère de séparation obligatoire pour indiquer unsignet ou unebalise,
- signet : identificateur du signet ou de la balise. Il s’agit d’un emplacement à l’intérieur de la page web retournée par le service, cette donnée sera traitée par lenavigateur web.

Quelques exemples :

URL deWikipédia :
http://fr.wikipedia.org/
URL de cettepage sur Wikipédia :
http://fr.wikipedia.org/wiki/Uniform_Resource_Locator
URL d'unfichier sur un siteFTP :
ftp://ftp.rfc-editor.org/in-notes/rfc2396.txt
URL d'unlien (mailto) vers uneadresse courriel :
mailto:quidam@exemple.com
URL d'unforum de discussion deUsenet :
news:fr.comp.infosystemes.www.auteurs
URL d'un siteGopher :
gopher://gopher.quux.org/
URL d'un siteGemini :
gemini://geminiprotocol.net/docs/specification.gmi
URL d'un fichier de l'ordinateur :
file:///home/joe/Documents/cv.pdf

URL relative

[modifier |modifier le code]

Les protocoles utilisant un chemin hiérarchique permettent l'utilisation d'URL relatives. Une URL relative ne contient pas de protocole, généralement pas de nom de domaine, et souvent un chemin incomplet. Ceux-ci sont déduits à partir de l'URL de la ressource contenant l'URL relative.

Les URL relatives sont souvent utilisées pour leshyperliens à l'intérieur d'un mêmesite web. Si le document d'URLhttp://fr.wikipedia.org/wiki/Web contient l'URL relativeNavigateur, cela correspond àhttp://fr.wikipedia.org/wiki/Navigateur. Les URL relatives sont directement inspirées de la syntaxe des systèmes de fichiersUnix. L'usage d'URL relatives permet de ne pas avoir à reprendre l'ensemble des liens lors du changement d'adresse d'un site.

L'URL :

./ correspond au dossier actuel ;
../ correspond au dossier parent ;
/ correspond au dossier racine ;
// correspond au domaine.

Jeu de caractères

[modifier |modifier le code]

Originellement, les adresses ne contenaient que des caractèresASCII. Pour pouvoir représenter des caractères non ASCII, il existe un système d'échappement codant en ASCII la valeurhexadécimale de chaqueoctet d'un caractère :%HH oùHH est un nombre hexadécimal. Toutefois, ce système d'échappement n'indique pas quel est lecodage de caractères sous-jacent (ISO/CEI 8859-1,UTF-8, etc.).

Une extension des URI a été créée pour étendre les adresses web au-delà de l'ASCII : lesInternationalized Resource Identifiers (IRI).

Media Resource Locator

[modifier |modifier le code]

Media Resource Locator (MRL) est une chaîne de caractères utilisée pour identifier des ressourcesmultimédia sur leWorld Wide Web ou en local (c’est-à-dire sur l'ordinateur de l'utilisateur). Le terme MRL est une analogie avec le terme URL.

Une MRL est utilisée pour la lecture de contenu multimédia enstreaming surInternet, de même que par certainslecteur multimédias commeVLC media player etXine.

Extension de raccourcis .URL

[modifier |modifier le code]

Les raccourcis d’adresse internet disponibles sur le bureau W11 par exemple ont pourextension .url. Cette extension a une particularité qu''elle partage avec l'extension des raccourcis de nom de fichiers.lnk : décocher la case "Masquer les extensions des fichiers dont le type est connu" ne suffit pas à les afficher. La procédure pour y arriver est complexe et potentiellement dangereuse quand elle passe par labase de registre. Elle est documentée dans le cas de .lnk .

Notes et références

[modifier |modifier le code]

Notes

[modifier |modifier le code]

Cet article est partiellement ou en totalité issu de l'article intitulé « Media Resource Locator »(voirla liste des auteurs).

Cet article est partiellement ou en totalité issu de l'article intitulé « Adresse web »(voirla liste des auteurs).

Références

[modifier |modifier le code]

↑« URL », surLarousse(consulté le10 octobre 2019).
↑« URL »,Grand Dictionnaire terminologique,Office québécois de la langue française.
↑^{a etb}« URL - Genre du mot - Dictionnaire Orthodidacte », surdictionnaire.orthodidacte.com(consulté le31 décembre 2024)
↑^{a etb}(en)Request for comments n^o 3986
↑^{a etb}(en)Request for comments n^o 1630
↑(en)Request for comments n^o 1738
↑(en)Request for comments n^o 1808
↑(en)Request for comments n^o 1737
↑(en)Request for comments n^o 2396
↑RFC 1945, chap 3.2
↑HTML 3.2 Reference Specification
↑(en)Request for comments n^o 3305
↑Weaving the Web,p. 66
↑Vocabulaire de l'informatique et de l'internet, Journal officiel [français] du 16 mars 1999,culture.gouv.fr
↑URL address / adresse URL
↑« Adresse permettant de localiser une ressource sur internet (URL) », surPix-Data.Com,14 juin 2023(consulté le27 juin 2023)
↑(en) LiamTung, « Chrome 69 kills off www in URLs: Here's why Google's move has made people angry », surZDNet(consulté le24 octobre 2019).
↑(en) « Chrome 76: no more https or www in address bar », surGhacks(consulté le24 octobre 2019).
↑(en)Tim Berners-Lee,Weaving the Web : the past, present and future of the World Wide Web by its inventor, London, Orion Business,1999(ISBN 978-0-752-82090-3,OCLC 894969957),p. 42
↑Au moyen d’un codage de caractèreUnicode sous la formeUTF-8 avant transformation des octets non ASCII en notation hexadécimale à deux chiffres par octet.

Voir aussi

[modifier |modifier le code]

Articles connexes

[modifier |modifier le code]

Standardisation (en anglais)

[modifier |modifier le code]

Sur les autres projets Wikimedia :

URL,sur leWiktionnaire

Documents définissants les recommandations etnormalisations liées aux URL :

(en)URIs, URLs, and URNs: Clarifications and Recommendations 1.0,21 septembre 2001, rapport duW3C et de laIETF sur les questions d'adressage.
(en)RFC 3986/STD 0066Uniform Resource Identifier (URI): Generic Syntax, définit la syntaxe et la sémantique des URI, URL et URN. RemplaceRFC 1738, modifieRFC 2732,2396 et1808. Cette RFC a le statut de standard (STD 0066). Définit l'usage d'adresses au formatIPv6 dans les URL.
(en)RFC 1630Universal Resource Identifiers in WWW, présente les URI, URL et URN, obsolète. Ancêtre de laRFC 1738.
(en)RFC 1738Uniform Resource Locators (URL) RFC qui a longtemps servi de base à la définition des URL et des URI. Elle définissait le format des URL pour différents protocoles comme Gopher, Mailto, etc. Le format des URL pour les requêtes de ces différents protocoles sont maintenant traités à part dans des documents propres à chacun. Obsolète, remplacée parRFC 3986.
(en)RFC 1808Relative Uniform Resource Locators, normalise les URL relatives, révisée par laRFC 3986.
(en)RFC 2368The mailto URL scheme, normalise les URL d'envoi de courriels.
(en)RFC 2396Uniform Resource Identifiers (URI): Generic Syntax, révisée parRFC 3986, révisait anciennement lesRFC 1738 etRFC 1808.
(en)RFC 2732Format for Literal IPv6 Addresses in URL's, normalise l'usage d'adresses au formatIPv6 dans les URL. Révisée par laRFC 3986.
Vocabulaire d'Internet -Banque de terminologie du Québec.

v ·m

Web sémantique

Contexte

Semantic Web Stack

Applications et interfaces

Règles	RIF Semantic Web Rule Language
Structure	Ontologies OWL SKOS Taxinomies RDFS
Requête	SPARQL

Échange

RDF

Syntaxe

Identifiant

HTTP
IRI
- URI
- URL

Caractères

Unicode

Autres ontologies

Articles liés

Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Uniform_Resource_Locator&oldid=230428268 ».

Catégories :

Catégories cachées :

[8]ページ先頭

©2009-2026 Movatter.jp