Extensible Markup Language (XML) is eenstandaard van hetWorld Wide Web Consortium voor de syntaxis van formeleopmaaktalen waarmee men gestructureerde gegevens kan weergeven in de vorm vanplatte tekst. Deze presentatie is zowelmachineleesbaar als leesbaar voor de mens. Het XML-formaat wordt gebruikt om gegevens op te slaan (zoals in hetOpenDocument-formaat) en om gegevens over hetinternet te versturen.
XML is een vereenvoudigde vorm vanStandard Generalized Markup Language (SGML), een complexe standaard om de structuur van documenten vast te leggen.
XML-talen gebruiken zogenaamde elementen en attributen om gegevens te structureren. De XML-specificatie definieert de syntaxis van elementen, attributen en de andere structuren die in XML-bestanden kunnen voorkomen. De XML-specificatie legt echter geen namen vast voor deze elementen en attributen, precies omdat deze keuze afhangt van het doel van het XML-bestand.
Een oudere van SGML afgeleide opmaaktaal isHyperText Markup Language (HTML). HTML heeft voor een doorbraak in SGML-achtig vormgegeven tekst gezorgd, maar gegevens die op een HTML-pagina staan zijn voor computers niet als zodanig te herkennen: in HTML kan men bijvoorbeeld wel titels en paragrafen markeren (tekstuele structuur), maar men kan niet vastleggen dat een bepaald gegeven een persoonsnaam, een telefoonnummer of een datum is (betekenis of semantische structuur). Met XML kan men echter opmaaktalen ontwikkelen waarmee dit wel kan.
Het gaat in dit bestandsformaat dus meer om destructuur van informatie, dit in tegenstelling tot HTML, of liever de manier waarop HTML veel gebruikt wordt, waarbij het meer gaat om depresentatie van de informatie. In deze HTML-bestanden beschrijven de tags wel hoe informatie moet worden gepresenteerd maar niet wat deze informatie betekent.
De afspraken over de te gebruiken tags in de "standaard"-dialecten worden formeel vastgelegd in zogenaamde DTD's (Document Type Definition) of in de nieuwereXML-Schemadefinities (XSD).Naast de te gebruiken tags wordt hierin ook beschreven welke gegevens acceptabel zijn en hoe ze precies moeten worden opgegeven (bijvoorbeeld een postcode bestaat uit 4 cijfers, 1 spatie en 2 letters).Het verschil tussen DTD en XSD is dat XSD-schema's hierin meer uitdrukkingskracht hebben; daarnaast is XSD zelf ook een XML-dialect dat met alle XML-tools kan worden bewerkt.
Hoe de gegevens opgemaakt zullen worden geef je op met eenXSL-document Extensible Stylesheet Language. Het is ook enigszins mogelijk om een XML-document op te maken met eenCSS-document. CSS (Cascading Style Sheets) is echter beter geschikt voorXHTML.Op zo'n manier geef je in XML door middel van XSD en XSL een keurige scheiding tussenopmaak eninhoud. Ook XSL is zelf een (standaard) XML-dialect.
Data in XML-formaat kunnen door middel vanXSLT-transformaties worden omgezet naar andere formaten zoals HTML,WML ofPDF maar ook naar een XML-document met een andere structuur. In het geval van de transformatie naar HTML kan deze bewerking zowel in de browser – op het moment van tonen – als op dewebserver plaatsvinden.
Voor het doorzoeken van XML-documenten zijn er standaard-querytalen ontwikkeld:XPath enXQuery.
Hoewel de XML-tags in principe vrij te kiezen zijn, is het bij uitwisseling van gegevens wel handig als er een gemeenschappelijke standaard wordt afgesproken. Op deze manier ontstaan er allerlei XML-dialecten, elk met een eigen specifieke toepassing. Een voorbeeld van een "standaard"-XML-dialect is de zogenaamdeRSS-standaard (Rich Site Summary of Really Simple Syndication) waarmee nieuwssites hun headlines kunnen publiceren voor RSS-diensten en RSS-software. Van nieuwssites zoalsNU.nl enSlashdot zijn bijvoorbeeld zogenaamde RSS-feeds beschikbaar.
De data hebben een XML-tag vast behoudend aan het HTML.
Om XML-RPC te gebruiken kan een module gebouwd worden, die simpel gezegd bestaat uit één of een aantalPHP-pagina's. Er wordt een request door middel van XML-RPC, RPC staat voorremote procedure call, van de client (kantoor) naar de server (website) gestuurd. Deze haalt nieuwe gegevens uit de database van de website en zet deze in een XML-bestand. Het bestand wordt dan door middel vanSOAP via hetHTTP-protocol verstuurd. Een connectie met een database als Access of eenERP-pakket alsSAP ofNavision wordt tot stand gebracht metODBC-drivers. Wanneer dit bestand aankomt op de server van de aanvrager, moet het XML-bestand omgezet worden naar de waarden van het informatiesysteem van de aanvrager. Dat gebeurt door middel van een DTD- of een XSLT-bestand. Na omzetting ontstaat een nieuw XML-bestand dat vervolgens ingeladen kan worden in het informatiesysteem. Dit hele gebeuren werkt voor een kantoormedewerker automatisch.