HyperText Markup Language (HTML,hypertekstmarkeringsspråk) er etmarkeringsspråk for formatering avnettsider medhypertekst og anneninformasjon som kan vises i ennettleser. HTML benyttes til å strukturere informasjon – angi noe tekst som overskrifter, avsnitt, lister og så videre – og kan, i en viss grad, brukes til å beskrive utseende ogsemantikk i et dokument. HTMLsgrammatiske struktur er HTMLDTD som ble skapt ved å gjøre bruk avSGMLsyntaks, som er en internasjonal standard for tekstformatering (ISO 8879).
Konseptet bak hypertekst stammer helt framiddelalderen, da det ble utviklet et system for kryssreferanser.Hypertekstrefererer i dag ikke overraskende til lenker, men «hyper» omfatter også at man kan legge inn «lenker» til filer med grafikk og bilder som nettleseren laster inn i dokumentet som om det var en integrert del. I 1940-årene skrevVannevar Bush artikkelenAs We May Think, der han beskrev etdatamaskin-drevet hypertekstsystem han kaltememex. Det var starten. Utover1960-tallet, da datamaskiner begynte å bli vanligere, ble det gjort flere forsøk på å lage et slikt system som var praktisk å bruke. Første gang et slikt system ble laget, slik vi kjenner det, var i1989, da HTML ble utviklet primært for å utveksle informasjon vedCERN. Systemet ble etter hvert populært rundt om på andre universiteter, og resten er historie.
HTML utveksles mellom maskiner gjennom et sett datamaskininstruksjoner kaltHyperText Transfer Protocol, HTTP. HTTP kan sammenliknes med sosiale regler (hva vi skal si når) på samme måte som HTML kan sammenliknes med et språk (hvordan vi sier det vi sier).
HTML-spesifikasjonen utvikles i offentlige fora vedWorld Wide Web Consortium (W3C), en medlemsorganisasjon som har som mål å jobbe for et samlet Internett. Organisasjonen består av representanter fra forskjellige selskaper, som alle publiserer innhold (f.eks. nettsider) eller utviklerprogramvare som brukes på Internett, slik somnettlesere ogvevtjenere. Av norske medlemmer kanOpera Software ogNRK nevnes. Spesifikasjonen for HTML legges ut i flere skisser (drafts) før den endelig vedtas. Denne prosessen tar gjerne langt over et år, og diskuteres grundig (og ofte høylytt) av alle interesserte i mellomtiden.
Et HTML-dokument består av en rekkeelementer, avgrenset avtagger, med forskjellige betydninger. Ved å «tagge» informasjonen man vil publisere, får man et HTML-dokument som kan legges ut på Internett (en nettside) og leses av en nettleser, som tolker de ulike elementene. Dokumentet vises så formatert i henhold til elementenes betydning. Elementene kan også hjelpe f.eks. søkemotorer med å forstå hvilken del av dokumentet som er tittelen, hva som er sitater osv.
Det er også vanlig at <head></head>-seksjonen inneholder metadata. Innholdet i slike metatagger er i hovedsak innhold som skal fanges opp av søkemotorer.Et element åpnes med en starttagg, <element>, og lukkes med en sluttagg, </element>. Man trenger ikke å lukke samtlige elementer, da de fleste nettlesere forstår hvor de fleste lukkes likevel. Det er likevel sterkt anbefalt av W3C å lukke elementene, da dette gjør arbeidet med å tolke dokumentet enklere både for mennesker og programmer.XHTML-standarden sier at manmå lukke alle elementer. Et element kan ha forskjelligeattributter som beskriver enkelte egenskaper ved det. På mange av elementene er det med attributter mulig å angi bakgrunn, farge o.l., men siden HTML-standarden i utgangspunktet ikke tok høyde for visuelle uttrykk, har man utviklet et nytt språk for dette, kaltCascading Style Sheets, som åpner for mer fleksible visuelle uttrykk.
h2 – h6 (Header 2 – Header 6) – Underoverskrifter (angir underseksjoner), oftest i mindre skrift jo høyere tall
b (Bold) – Gir fet skrift, men ingen viktighetshentydning
em (Emphasis) – Indikerer vektlagt tekst, vises normalt i kursiv
i (Italics) – Gir kursiv tekst
a (Anchor) – En lenke til en annen ressurs på nettet (nettside, e-postadresse, nyhetsgruppe etc.)
p (Paragraph) – Et avsnitt, vises som regel med en blank linje over og under
table (Table) – Lager en tabell
ul (Unordered List) – Punktliste
ol (Ordered List) – Nummerert liste
br (Break) – Linjeskift
div (Division) – Som avsnitt, med linjeskift foran og bak, men normalt uten blank linje over og under, ofte brukt som skille for egne CSS-definisjoner eller med id-er som Javascript-programkode skal gjøre operasjoner på
span (Span) – Som div men normalt uten linjeskift foran og bak
pre (Preformatted) – vises normalt i en skrifttype der alle bokstaver og tegn er like brede og der linjeskift i HTML-en tas hensyn til, ofte brukt i egenoppsatte "tabulerte" tabeller uten bruk av <table>
strong (Strong) – Indikerer viktig tekst, vises vanligvis i fete typer
form (Form) – Benyttes for skjemaer rundt input-skjemaelementer, skrivefelt, tekstredigeringsområder, nedtrekksmenyer, knapper, avkryssningsbokser, flervalgsruter og lignende med elementeneinput,select ogtextarea.
Nettleserne har standardinnstillinger for hvordan disse elementene vises frem, bl.a. forskriftstyper, skriftsstørrelser, størrelse på mellomrom, farger osv. Overstyring for å bestemme egne innstillinger for HTML-dokumentet skjer normalt vhaCSS.
Dette er den versjonen av HTML somTim Berners-Lee ogRobert Caillau utviklet i1991. Denne versjonen inneholdt bare grunnleggende elementer for tekststrukturering. De fleste av disse er i dag utgått eller har blitt forandret.
Etter HTML 2.0 kom det mange forskjellige miljøer med egne versjoner av HTML, noe som førte til vanskeligheter med å lese dokumentene med mindre man hadde de rette programmene.HTML + var ment å være en fornyelse og forbedring av HTML-språket som alle kunne lese. Det ble laget støtte for tabeller, og strukturen i dokumentet ble formalisert. Det var på dette stadiet at dokumentene begynte å se ut som beskrevet ovenfor. HTML + ble foreslått avDave Ragget i1993, men ble aldri tatt opp som formell standard.
Ingen av nettleserprodusentene implementerte alt av HTML 3.0 eller HTML +, så man hoppet rett på versjon 3.2 som bare tok opp i seg de viktigste delene av det de forskjellige produsentene allerede hadde laget, HTML 3.0 og HTML +. Mange elementer ble dermed ofret. HTML 3.2 er i all hovedsak grunnlaget for HTML slik vi kjenner det i dag.
I all hovedsak HTML 4, men med strengere syntaktiske regler (lukke alle elementer etc.). Ordet er en sammenføyning av HTML ogXML. Grunnen til at man vil ha reglene så strenge er blant annet at utbredelsen av såkalteWYSIWYG-programmer, som har gjort det lettere å lage internettsider, har ført til mer rot og flere sider som ikke følger standardene. En annen grunn er at sider som følger de rigide, men ryddige reglene blir lettere å lese for små datamaskiner, som for eksempelPDA-er ogMobiltelefoner.
HTML5 er lansert og tok over for HTML4 i oktober 2014. Et av hovedmålene til HTML5 er å minimere behovet for å måtte installere eksterne programvarer ("plugins",webapplikasjoner) somAdobe Flash,QuickTime ogSilverlight da lyd, video, vektorgrafikk og interaksjon er mer støttet direkte i nettleseren. HTML5 med Javascript støtter også bedregeolokasjon oglokasjonsbaserte tjenester, i tillegg til nyere åpne formater som skalerbarvektorgrafikk. HTML5 ble godkjent som en W3C Recommendation 28. oktober 2014.[1]