Pagina's in dit artikel
-
Wat is XML
-
Kenmerken van XML
-
Opbouw van een XML bestand
-
XML Schema's
-
XML in Excel
-
XML Validatie
-
Conclusie
Wat is XML
XML staat voor eXtended Markup Language. XML is een standaard die
voor het web is bedacht, met als achtergrond het eenvoudig opzoekbaar
maken van gegevens. De gedachte erachter is, dat men informatie voorziet
van omschrijvende tags, die de informatie eenvoudig vindbaar moeten
maken. Zo zou eenieder die een mop op het Internet plaatst, de tekst van
de mop kunnen voorzien van de tags "<mop> …. </mop>", waarna
zoekmachines eenvoudigweg naar deze tags zoeken wanneer iemand op zoek
is naar moppen. Figuur 1 toont een stukje XML "code". Zoals te zien is
heeft het veel weg van HTML. Betekent dit, dat XML een dialect van HTML
is?
Figuur 1, XML bestand zoals getoond door Internet Explorer
Net als HTML is XML is een zogeheten markeer taal of metataal, een
taal die informatie geeft over een andere taal, ofwel informatie
verschaft over de inhoud. Markeer codes bestaan in feite al vrij lang.
Redacteuren gebruikten lang geleden al codes om voor delen van de tekst
aan te geven welke formattering gewenst was (bijvoorbeeld cursief). In
de jaren zestig is bij IBM de "Generalized Markup Language" (GML)
ontwikkeld, om hetzelfde te kunnen doen met elektronische bestanden. In
1986 is deze uitgebreid en opgenomen als ISO standaard als de zogeheten
"Standard Generalized Markup Language" (SGML). Deze SGML is later door
de onderzoekers van het CERN instituut te Zwitserland verder uitgewerkt,
omdat zij met het probleem zaten hoe ze hun elektronisch opgeslagen werk
(met bijvoorbeeld veel verwijzingen naar andere documenten en
vergelijkingen in de tekst) op een handige manier van
formatterings-informatie konden voorzien, zodat de informatie bij
iedereen op dezelfde manier zou worden weergegeven en zodat het
eenvoudig werd om met de verwijzingen te werken. De hiervoor bedachte
structuur is de basis voor onze huidige HTML.
Zowel HTML als XML is dus afgeleid van SGML, de "Standard Generalized
Markup Language". Beide worden beheerd door het World Wide Web
consortium, (W3C) zie: http://www.w3.org/).
Zowel XML als HTML gebruikt "tags", maar met een verschillend doel.
HTML is vooral een standaard om formattering van gegevens te kunnen
aanduiden. Bij HTML liggen de mogelijke tags vast in de standaard, het
is niet mogelijk eigen tags te maken. Bovendien zeggen de HTML tags over
het algemeen niets over de inhoud van de informatie, alleen iets over de
representatie ervan. XML richt zich juist op het kenmerken van de inhoud
van de gegevens en niet op de formattering. Bij XML is het aan de
gebruiker om te bepalen welke tags gedefinieerd worden, hierin is een
grote mate van vrijheid gegeven.