L'HTML è un linguaggio dipubblico dominio, la cuisintassi è stabilita dalWorld Wide Web Consortium (W3C). È derivato dall'SGML, unmetalinguaggio finalizzato alla definizione di linguaggi utilizzabili per la stesura di documenti destinati alla trasmissione in formato elettronico. La versione attuale, la quinta, è stata pubblicata dal W3C nell'ottobre 2014.
Il motivo principale che ha spinto il W3C e i suoi membri a sviluppareHTML5 è stata la necessità di fornire direttamente le funzionalità che in precedenza erano fruibili tramite estensioni proprietarie all'esterno dei browser, comeAdobe Flash e simili. Un secondo obiettivo che gli sviluppatori si erano prefissati era quello di garantire una maggiore compatibilità tra i diversi browser, indipendentemente dallapiattaforma software utilizzata, e principalmente mirata all'espansione deidispositivi mobili.[3]
L'HTML è stato sviluppato nei primissimianni novanta delXX secolo daTim Berners-Lee alCERN diGinevra (Svizzera), assieme al protocolloHTTP dedicato al trasferimento di documenti in tale formato. Nel 1989 Berners-Lee propose un progetto che riguardava la pubblicazione diipertesti, noto con il nome di "world wide web". All'interno di questo progetto in seguito nacquero sia il server web "httpd" (HyperText Transfer Protocol Daemon), sia il clientWorldWideWeb (il primo browser della storia), il cui sviluppo partì nell'ottobre del 1990, e il cui uso fu esclusivamente interno al CERN fino alla sua pubblicazione nella reteinternet nel corso del 1991. Assistito dai suoi colleghi all'interno dell'istituto Svizzero, Berners-Lee concorse alla definizione della prima versione dell'HTML, che fu ufficialmente resa pubblica nel giugno del 1993, co-firmata insieme a Daniel Connolly e sostenuta dal gruppo di lavoro dell'Internet Engineering Task Force (IETF) chiamatoIntegration of Internet Information Resources ("Integrazione delle risorse informative di Internet"), per proporla come standard IETF.[1]
Esempio di pagina HTML
Nel 1994 il linguaggio ha avuto una forte diffusione in seguito ai primi utilizzi commerciali delweb, così nello stesso anno nacque ilWorld Wide Web Consortium, e da quel momento in poi, lo sviluppo dell'HTML diverrà prerogativa del W3C.
Nel 1995 ilW3C definì la versione 3.0 di HTML, a cui seguì la versione 3.2 nel 1997, e infine arrivarono nel 1998 le prime specifiche diHTML4.
La versione 4.01, pubblicata il 24 dicembre 1999 e penultima versione ufficiale, costituisce il frutto dei diversi ampliamenti e miglioramenti del decennio precedente, in particolare nella separazione del livello presentazionale della formattazione, cioè quella che descrive gli aspetti grafici del documento, in un'entità separata dall'HTML, i fogli di stile a cascata (CSS), definiti nello stesso anno nella loro prima versione, il livello 1[4]. Tale distinzione, tra contenuto e aspetto finale del documento, permette a browser e dispositivi differenti di rappresentare gli stessi contenuti in maniera consona alle diverse capacità grafiche e dimensioni disponibili. Se da una parte questo impone aglisviluppatori web la creazione di personalizzazioni dei fogli di stile, dall'altra ha garantito la massima diffusione del web ed evitato che esso diventasse unmedium diélite.
Nel gennaio 2000, viene pubblicato come standardXHTML 1.0[5], una variante diHTML4 che usaXML 2.0 anzichéSGML come metalinguaggio di markup, per migliorarne l'interoperabilità con altri linguaggi della famiglia comeSVG eMathML[6] Il W3C decise di riformulare l'HTML4 e di continuare lo sviluppo solo su XHTML[7] e nel maggio 2011 XHTML 1.1 diventa uno standard ufficiale[8].
Nel corso del nuovo millennio, ilW3C cominciò a lavorare a due nuovi progetti, uno orientato a estendere l'XHTML, e l'altro destinato a definire un nuovo linguaggio che non sarebbe stato compatibile con le vecchie versioni di HTML e XHTML, noto con il nome diXHTML 2 (quest'ultimo progetto è stato dichiarato ufficialmente fallito alla fine del 2010, in favore di un approccio meno rigido).
Nel 2004, a seguito di una giornata di studi, nasce un gruppo di lavoro alternativo al consorzio:Apple,Mozilla Foundation,Opera Software e, in un secondo momento, ancheGoogle, si riuniscono nelWeb Hypertext Application Technology Working Group (WHATWG) e cominciano lo sviluppo di una nuova versione dell'HTML, preoccupati dal disinteresse per l'HTML dimostrato dal consorzio[9]. Nel 2006 il W3C decide di prendere parte allo sviluppo diHTML5 e nel 2007 si unì alWHATWG, i due gruppi collaborano fino al 2011, quando si rendono conto di avere obiettivi inconciliabili: il consorzio voleva tracciare una linea e pubblicare una nuova versione delle specifiche standard, mentre il WHATWG voleva uno standard in continua evoluzione[7]. Il W3C ha pubblicato la quinta revisione delle specifiche il 28 ottobre 2014[2].
Attualmente i documenti HTML sono in grado di incorporare molte tecnologie, che offrono la possibilità di aggiungere al documento ipertestuale controlli più sofisticati sulla resa grafica,interazioni dinamiche con l'utente, animazioni interattive e contenutimultimediali. Si tratta di linguaggi comeCSS,JavaScript,XML,JSON, o di altre applicazioni multimediali dianimazione vettoriale o distreaming audio ovideo.
Al giorno d'oggi moltiweb designer delegano la scrittura del codice HTML adapplicazioni specifiche, come per esempio i cosiddetti editorWYSIWYG che permettono al designer di occuparsi dell'aspetto grafico finale della pagina mentre il codice vero e proprio viene generato automaticamente. Gli sviluppatori puri preferiscono invece utilizzare direttamente il codice HTML, in modo da avere un maggior controllo sul risultato finale e sulla pulizia del codice scritto, cosa che gli editor WYSIWYG odierni nonostante siano sempre più avanzati non possono sempre garantire, vuoi anche per la diversa resa dei browser sulle parti di codice HTML.
Il linguaggio HTML, o la sua varianteXHTML, ha come scopo quello di gestire i contenuti associandone o specificandone allo stesso tempo la struttura grafica (layout) all'interno della pagina web da realizzare grazie all'utilizzo ditag diversi. Ogni tag (ad esempio<h1> o<p>) specifica un diverso ruolo dei contenuti che esso contrassegna (quindi il tag<h1> definirà un'importanza maggiore del tag<p>). La formattazione consiste nell'inserimento nel testo di marcatori o etichette, dettitag, che descrivono caratteristiche come la funzione, il colore, le dimensioni, la posizione relativa all'interno della pagina. Ibrowser che leggono il codice mostrano all'utente formattazioni predefinite per ogni tag che incontrano (così per esempio i contenuti marcati con il tag<h1> avranno carattere 18pt e i contenuti marcati da<p> avranno carattere 12pt). Tuttavia questa formattazione è completamente sotto il controllo dell'utente, che può modificarla nelle impostazioni del proprio browser.
I documenti HTML vengono immagazzinati suidischi rigidi di macchine elaboratrici (computer-server) costantemente collegate econnesse alla reteInternet. Su queste macchine è installato un software specifico (web server) che si occupa di produrre e inviare i documenti ai browser degli utenti che ne fanno richiesta usando il protocolloHTTP per iltrasferimento dati.
Spesso il documento HTML viene generato del tutto o parzialmente tramite uncodice eseguibile residente sul server Internet (elaborazionelato server) in grado di interagire con altre applicazioni presenti sul server stesso, come per esempio unabase di dati, e inviare poi al browser il risultato finale, realizzando le cosiddettepagine web dinamiche con cui un utente può compiere operazioniinterattive avanzate (ad esempio filtrare gli articoli all'interno di un catalogo on-line, inviare e registrare dati, farelogin ecc.). È il caso di documenti scritti in linguaggi comeASP,PHP,Perl oJava. In altri casi invece alcuni tipi di elaborazione sono operatilato client con linguaggi comeJavaScript.
Il componente principale dellasintassi di questo linguaggio è l'elemento, inteso come struttura di base a cui è delegata la funzione di formattare i dati o indicare albrowser delle informazioni.
Ogni elemento è racchiuso all'interno di marcature dettetag, costituite da una sequenza di caratteri racchiusa tra due parentesi angolari o uncinate (<>), cioè i segni minore e maggiore (Es.:<br/>; il tag di questo esempio serve per indicare un ritorno a capo).
Quando il tag deve essere applicato a una sezione di testo o di codice, l'ambito di applicazione deve essere delimitato fra un tag di apertura e uno di chiusura (chiusura esplicita), che coincide col tag di apertura preceduto da una barra (/) dopo la parentesi angolare aperta (Es.:<b>testo testo testo</b>, in questo caso, il testo compreso tra questi due tag verrà visualizzato in grassetto dal browser).
Alcuni tag presentano un'applicazione puntuale, come per esempio il tag<img> che serve per inserire un'immagine in un determinato punto della pagina, e in quanto tali non richiedono il tag di chiusura; in questo caso si parla ditag a chiusura implicita. InXHTML, invece, la chiusura implicita è proibita e tutti i tag devono essere sempre chiusi esplicitamente tramite un tag di chiusura o, nel caso dei tag puntuali, usando il carattere '/' alla fine del tag stesso (per esempio<br/>). Per questi tag, i browser sono in grado di accettare entrambe le modalità, per motivi di compatibilità.
Un documento HTML inizia con una dichiarazione del tipo di documento, una breve stringa che indica in quale sintassi e relativa versione esso sia scritto, per esempio HTML 4.0 Strict. Tale informazione è necessaria al browser per identificare le regole di interpretazione e visualizzazione appropriate per lo specifico documento, ed è per questa ragione che la dichiarazione deve precedere il documento vero e proprio.
Ogni versione del linguaggio HTML precedenti alla quinta, ovvero fino ad HTML 4.01 o XHTML 1.1, possiede una sintassi formalmente definita da unadefinizione del tipo di documento (DTD) che, pubblicata sul web dal W3C, indica, per ogni versione, quali elementi, attributi ed entità possano o debbano essere utilizzati, e in quale maniera; pertanto in questi casi la dichiarazione del tipo di documento deve (può, nel caso delle varianti XML) comprendere anche l'URL di tale risorsa. La quinta versione di HTML, invece, non possiede alcuna DTD, pertanto in questi casi la dichiarazione iniziale indica la mera dicitura "HTML".
Per dichiarare un documento che utilizzerà lo standard HTML5 si utilizza il tag<!DOCTYPE html>.
Dopo la dichiarazione del tipo di documento, il documento HTML presenta una struttura ad albero annidato, composta da sezioni delimitate da tag opportuni che al loro interno contengono a loro volta sottosezioni più piccole, sempre delimitate da tag.
La struttura più esterna è quella che delimita l'intero documento, eccetto la DTD, ed è compresa tra i tag<html> e</html>.
All'interno dei tag<html> lo standard prevede sempre la definizione di due sezioni ben distinte e disposte in sequenza ordinata:
la sezione di intestazione oheader, delimitata tra i tag<head> e</head>, che contiene informazioni di controllo normalmente non visualizzate dal browser, con l'eccezione di alcuni elementi
la sezione del corpo obody, delimitata tra i tag<body> e</body>, che contiene la parte informativa vera e propria, ossia il testo, le immagini e i collegamenti che costituiscono la parte visualizzata dal browser.
Al di sotto di questa suddivisione generale, lo standard non prevede particolari obblighi per quanto riguarda l'ordine e il posizionamento delle ulteriori sottosezioni all'interno dell'header o delbody, a parte l'indicazione del rispetto dei corretti annidamenti (le sottosezioni non si devono sovrapporre, ossia ogni sottosezione deve essere chiusa prima di iniziare la sottosezione successiva), lasciando così completa libertà allo sviluppatore o al progettista per quanto riguarda la strutturazione e l'organizzazione successive.
I tag utilizzati nella sezionehead sono tipicamente di tipo diverso da quelli utilizzati nella sezionebody, essendo destinati a scopi differenti. I tag utilizzati nella sezionehead normalmente non vengono visualizzati dal browser ma servono come informazioni di controllo e di servizio quali:
metadata per convogliare informazioni utili ad applicazioni esterne (es. motori di ricerca) o al browser (es. codifica dei caratteri, utile per la visualizzazione di alfabeti non latini)
metadata di tipohttp-equiv per controllare informazioni aggiuntive nel protocolloHTTP
collegamenti verso file di servizio esterni (CSS, script, icone visualizzabili nella barra degli indirizzi del browser)
inserimento discript (codice eseguibile) utilizzati dal documento
informazioni di stile (CSS locali)
il titolo associato alla pagina e visualizzato nella finestra principale del browser
All'interno della sezione dibody, che racchiude la parte visualizzabile del documento, si utilizzano i tag specifici previsti per laformattazione dei contenuti accessibili all'utente finale, ossia per il controllo di:
intestazioni (titoli di capitoli, di paragrafi eccetera)
strutture di testo (testo indentato, paragrafi, eccetera)
aspetto del testo (grassetto, corsivo, eccetera)
elenchi e liste (numerate, generiche, di definizione)
tabelle
moduli elettronici (campi compilabili dall'utente, campi selezionabili, menu a tendina, pulsanti eccetera)
Tra quelli elencati sopra, il tag<a> è quello che gioca un ruolo chiave in quanto descrive un collegamento (olink) a un altro documento ipertestuale consentendo, con un click delmouse o con un'operazione datastiera, di abbandonare la pagina o il sito che si sta visualizzando e caricare quella indicata dal link, realizzando così la funzione di navigazione tipica dell'uso di Internet.
Il codice HTML è costituito da tag che definiscono i vari elementi della pagina web, come il testo, le immagini, le tabelle, i moduli e così via. I tag vengono inseriti all'interno del codice HTML utilizzando parentesi angolari, e la maggior parte dei tag viene aperta con un tag di apertura e chiusa con un tag di chiusura corrispondente. Alcuni tag, come il tag per l'immagine, non richiedono un tag di chiusura. Ecco la lista dei principali tag:
Haml (HTML Abstraction Markup Language) è un sistema di modelli progettato per evitare di scrivere codiceinline in un documento web e rendere l'HTML più pulito. Haml offre la flessibilità di avere alcuni contenuti dinamici in HTML. Simile ad altri linguaggi web come PHP, ASP, JSP e sistemi di modelli come eRuby, Haml incorpora anche del codice che viene eseguito durante ilruntime e genera codice HTML per fornire alcuni contenuti dinamici. Per eseguire il codice Haml, i file devono avere un'estensione.haml. Questi file sono simili ai file.erb o eRuby; aiutano anche a incorporare il codice Ruby durante lo sviluppo di un'applicazione web[12].
Esempio
Haml utilizza il rientro degli spazi (due spazi) per la nidificazione e l'ambito dei tag che funge da sostituto per le coppie di tagopen-end, rendendolo asciutto e più pulito. L'esempio seguente confronta le sintassi di Haml ed eRuby (Embedded Ruby), insieme all'output HTML.
<divclass="category"><divclass="ricette"><h1>Cookie</h1><h3>Dessert</h3></div><div><h4>A base di pasta e zucchero. Di solito di forma circolare e ha circa 400 calorie.</h4></div></div>
Le mappe immagine lato client sono state introdotte in HTML 3.2 e non richiedono alcuna logica speciale per essere eseguite sul server (sono completamente lato client). Inoltre non richiedono JavaScript.
Sopra una mappa immagine fatta con iltag<map>. Sotto tre immaginiPNG trasparenti (si può usare anche il formatoGIF) inserite con<img> e aventi dei link<a>. Solo per quanto riguarda quadrati e rettangoli il risultato è lo stesso. Il rosso rappresenta un'immagine e il giallo le aree cliccabili
Una mappa immagine lato client in HTML è composta da due parti:
l'immagine reale, che è incorporata con il tag<img>. Il tag "image" deve avere un attributousemap, cheassegna un nome alla mappa immagine da utilizzare per questa immagine (possono esistere più mappe immagine su una singola pagina).
Un elemento<map> e, al suo interno, elementi<area>, ciascuno dei quali definisce una singola area cliccabile all'interno della mappa immagine. Essi sono simili al tag<a> che definisce l'URL da aprire per un normale collegamento web. Un attributotitle può essere inserito e visualizzato come un suggerimento se un utente desktop passa il puntatore del mouse sull'area. Per motivi diaccessibilità web, è spesso importante — e in alcuni casi può anche essere un requisito legale o contrattuale — fornire un attributoalt che descriva il collegamento che il software di lettura dello schermo può leggere, per esempio, per gli utenti non vedenti[13].
Gli elementi<area> possono essere rettangoli (shape="rect"), poligoni (shape="poly") o cerchi (shape="circle"). I valori di forma sono coppie di coordinate. Ogni coppia ha un valore e (da sinistra / in alto di un'immagine) ed è separata da una virgola.
Rettangolo: impostare quattro coordinate:x1,y1,x2,y2
Poligono: impostare tutte le coordinate che si desidera (un multiplo di due):x1,y1,x2,y2, [...]xn,yn
Cerchio: una coppia di coordinate e un altro valore con un raggio:x1,y1,raggio
L'esempio seguente definisce un'area rettangolare (9,372,66,397). Quando un utente fa clic in un punto qualsiasi di quest'area, viene indirizzato alla home page di Wikipedia in inglese.
È possibile creare mappe immagine lato client a mano utilizzando un editor di testo, ma per farlo è necessario che i web designer sappiano come codificare HTML e come enumerare le coordinate delle aree che desiderano posizionare sull'immagine. Di conseguenza, la maggior parte delle mappe immagine codificate a mano sono semplici poligoni. Poiché la creazione di mappe immagine in un editor di testo richiede molto tempo e impegno, molte applicazioni sono state progettate per consentire ai web designer di creare mappe immagine rapidamente e facilmente, proprio come creerebbero forme in un editor di grafica vettoriale. Esempi di queste applicazioni sonoDreamweaver di Adobe o KImageMapEditor (per KDE) e un plugin di mappe immagine diGIMP[14].
Le mappe di immagini che non rendono evidenti le loro aree cliccabili rischiano di sottoporre l'utente a una navigazione misteriosa. Anche quando lo fanno, dove conducono potrebbe non essere ovvio. Questo può essere parzialmente risolto con effetti di rollover[15].
Poiché il formato immagine SVG (Scalable Vector Graphics) fornisce i propri meccanismi per l'aggiunta di collegamenti ipertestuali e altre forme più sofisticate di interattività alle immagini, le tecniche tradizionali di mappatura delle immagini non sono generalmente necessarie quando si lavora con immagini vettoriali nel formato SVG. Esempio (una mappa immagine rettangolare)[16]:
Esistono alternative visivamente identiche alle mappe immagine create con iltag<map>. Esse consistono nel creare forme e/o maschere di immagini con varie tecniche CSS, renderle cliccabili, nasconderle con opacità "0" o inserendo GIF o PNG o SVG trasparenti e infine sovrapporle ad un'immagine[17][18][19].
IlWorld Wide Web Consortium cura un sito web chiamatoW3C Validator, progettato per validare rapidamente una qualsiasi pagina HTML e segnalare eventuali errori, al fine di poter effettuare una rapida correzione verso un rispetto più rigido agli standard e alle raccomandazioni ufficiali.[20][21]
IlW3C Validator è spesso citato nelle dichiarazioni diaccessibilità dei siti web, fra cui siti web della pubblica amministrazione.[22]
HTML Tidy è uno strumento ideato dal ricercatore e sviluppatoreDave Raggett[23], per aiutare ad evitare di fare errori nella stesura di codice HTML.
Tidy infatti si occupa di correggere tutti gli errori più tipici in cui si incorre durante lo sviluppo di codice web. Inoltre si occupa di rendere leggibile il codice generato da editor HTML, e di segnalare all'utente dove deve prestare più attenzione. Riesce a riconoscere una vasta gamma di errori, segnalandoli comewarnings (avvertimenti), ai quali affianca numero di riga e colonna.