Uniform Resource Locator
Webbadress

EnURL (från engelskan:Uniform Resource Locator) är denteckensträng som identifierar en viss resurs på internet, till exempel enwebbsida (varvid URL:n kan kallaswebbadress):http://www.example.org/nyheter/dagens.html
. Webbadressen är en del av infrastrukturen förWorld Wide Web och gör en resurs tillgänglig för enwebbläsare. Tekniken skapades avTim Berners-Lee och presenterades1989.[1] URL:en är konstruerad för att peka ut resurser påInternet (eller t.ex. ett intranät) och ange hur de kan hittas. En URL kan även användas för att hitta en fil på den egna datorn. JämförURI ("Uniform Resource Identifier").
En webbadress innehåller ett antal element med mer eller mindre väldefinierad funktion. Beroende på det protokoll som används (och definieras först i adressen) kan tolkningen av delarna skilja och vissa delar vara överflödiga. Vissa av delarna tolkas av allmän internet-programvara, vissa av servern och vissa av webbläsaren.
Exempelvis URL:enhttps://sv.wikipedia.org:80/w/index.php?title=Dator&action=edit#Historia
består av sex olika delar som var och en visar olika information som är nödvändig för att hitta viss information på Internet.
https:
("schemat") talar om hur resten av URL:en skall tolkas, och indirekt ofta vilketprotokoll (språk) som skall användas. I detta fall används protokolletHTTPS (det vanligaste på WWW). Allt som följer efter:
beror på vilket schema som man har angett i URL:en. Ett i tiderna vanligt protokoll varFTP (ftp://användarnamn:lösenord@domain/sökväg/fil
), ett fortfarande vanligt ärfile://
för en lokal fil. Telefonnummer kan anges somtel:+46-8-1234-5678
[2].
(Datorn avgör ofta på basen av schemat vilket program som ska användas för att öppna länken, till exempel öppnasirc:
i ensirc-klient,mailto:
i ensE-post-klient ochdchub:
iDirect Connect).//sv.wikipedia.org
talar om vilken domän (dator) vi ska leta oss fram till. Genomdomännamnssystemet omvandlasdomännamnet till enIP-adress (IP-adressen kan också ges direkt). I det ursprungliga HTTP-protokollet var detta delens enda betydelse, men med tanke påwebbhotell ochvirtuella domäner skickas numera domännamnet också till servern.:80
talar om vilkenport i mottagardatorn vi ska använda.TCP-port 80 som används i det här fallet är standard vid kommunikation med en HTTP-server och kunde därför utelämnas./w/index.php
berättar för servern vilken resurs vi vill komma åt, ofta vilkenfil vi söker på serverdatorn. Ofta består denna del av ett filnamn, inklusive dess läge ifilträdet relativt någon för webbservern definierad baskatalog. Snedstrecket avskiljer element i en hierarki, men i övrigt är tolkningen beroende på webbserverns inställningar (istället för en fil kan här till exempel syftas på en post i endatabas).?title=Dator&action=edit
är extra information vi ska skicka till Wikipedias server, ofta parametrar till ett datorprogram (som ibland anges genom filnamnet men i allmänhet väljs genom webbserverns konfiguration). I det här fallet ska vi gå till artikeln Dator (title=Dator) och redigera den (action=edit).#Historia
talar om att webbläsaren ska hoppa till stycket Historia. Denna del skickas inte till webbservern utan tolkas lokalt med hjälp avankare som ingår i webbsidansHTML-kod.
Den del av en webbadressen som uppfattas som sökstig, filnamn och parametrar (”/w/index.php?title=Dator&action=edit”) i exemplet ovan tolkas av webbservern och behöver alltså inte betyda någonting visst. Det är ändå praxis att tolka den på vissa sätt och det är en fördel om webbadresserna konstrueras så att både administratörer och besökare kan dra slutsatser om webbplatsens logiska struktur, möjligen också dess fysiska struktur, utgående från dem.
Ett vanligt sätt att använda adressen är att låta den första delen vara en sökstig från en basadress till den fil som skall visas, till ett skript (datorprogram) som skall generera den önskade sidan eller liknande. Vilken basadress som skall användas beror ofta på den första delen av adressen. En eventuell parameterdel ges som indata åt programmet. En sådan struktur är lätt att tolka för dem som arbetar med webbservern. En annan modell är att låta adressen avspegla en logisk struktur, oberoende av hur filerna ligger på datorn. I bästa fall sammanfaller de båda i rätt stor utsträckning.
Då allt fler webbplatser använder databaser som inte är beroende av filträdet på datorns hårddisk, utan istället använder nycklar, är det rätt vanligt att adressen är en kod utan betydelse annat än inne i databasen. En sådan adress är svår att komma ihåg eller ens teckna ner och minsta misstag leder till att rätt resurs inte hittas. Därmed tvingas användaren ofta söka rätt på den önskade resursen med början från webbplatsens huvudsida, vilket ibland är avsikten.
Ett speciellt problem är då webbplatsen omorganiseras eller serverprogramvaran byts ut. Ofta är resultatetlänkröta, att adresser till webbplatsen i "bokmärken" och runt kring Internet upphör att fungera. Genom att adresserna ursprungligen valts enligt ett logiskt schema gör man det enklare att omdirigera dem till rätt sida efter ändringen.
Engelska bokstäver A–Z och a–z, siffror 0–9 samt tecknen- _ . ~
kan användas fritt som de är i en URL. Övriga tecken i en URL måste URL-kodas för att överföras korrekt. Det gäller dels reserverade tecken som har speciell betydelse i en URL, såsom& # / ? +
, dels alla övriga tecken. Vill man använda dessa (t.ex. för att de ingår i ett filnamn) måste de kodas med ett procenttecken och tvåhexadecimala siffror. För domännamnet gäller skilda regler för kodningen (se "internationella domännamn",IDN, ochpunycode).
För binära värden, som inte är text, kodar man byte för byte. För text, vilket är det vanligaste (mera specifikt är det oftast filnamn) måste man koda tecknen enligt rättteckenkodning, så att servern hittar filen ifråga. Enligt den standard som gällt sedan 2005 använder manUnicode kodad medUTF-8. Det innebär en byte för ASCII-tecken (7-bits) och 2 bytes för (nästan alla) övriga latinska ochkyrilliska tecken, och tre bytes för (nästan alla) övriga tecken. Sedan kodas varje byte med % och två hexadecimala siffror. Normalt sköts kodningen automatiskt av webbläsaren, åtminstone nyare webbläsare.
Servrar kan vara konfigurerade att använda en annan teckentabell, till exempelLatin-1. I så fall bör webbadressen alltid skrivas med %-kodning. Traditionellt undviker man helt enkelt tecken utöverUS-ASCII, till exempel å,ä,ö. För att säkerställa en korrekt överföring av adressens tecken anges de enligt följande exempel:
Tecken | Kod (Latin-1) | Kod (unicode) |
---|
<space> | %20 | %20 |
% | %25 | %25 |
& | %26 | %26 |
, | %2C | %2C |
å | %E5 | %C3%A5 |
ä | %E4 | %C3%A4 |
ö | %F6 | %C3%B6 |
ü | %FC | %C3%BC |
Å | %C5 | %C3%85 |
Ä | %C4 | %C3%84 |
Ö | %D6 | %C3%96 |
æ | %E6 | %C3%A6 |
ø | %F8 | %C3%B8 |
é | %E9 | %C3%A9 |
ć | finns ej | %C4%87 |
œ | finns ej | %C5%93 |
華 | finns ej | %E8%8F%AF |
Exempel:http://sv.wikipedia.org/wiki/Malmö bör skrivas somhttp://sv.wikipedia.org/wiki/Malm%C3%B6 . Nyare webbläsare gör detta automatiskt. |
När det gäller själva domännamnet används en annan nyare och mer kompakt standard,Punycode