Wat de Dublin Core mislukking ons kan leren
Ook gastschrijver worden? Meld je dan nu aan!

Het web is als een bibliotheek waar alle boeken op een grote hoop gegooid zijn; er zit totaal geen orde in. Oké.. er zijn wel zoekmachines, maar met duizenden resultaten voor één zoekopdracht is dit nou ook weer niet optimaal. In lijn met de ideeën achter een nieuw semantisch internet werd Dublin Core metadata geïntroduceerd. Het beloofde een revolutie te worden. De manier waarop het web gebruikt werd zou nooit meer hetzelfde zijn. De mislukking die het uiteindelijk geworden is, is een uitstekend voorbeeld van de moeilijke weg die het semantische web nog heeft af te leggen.
Een korte uitleg
Het semantische web is een nieuwe versie van het internet. Het web wordt hierbij een universeel medium waarbij alle soorten informatie (mensen, foto’s, spraak, gebeurtenissen, plaatsen, organisaties, etc.) kunnen worden uitgewisseld. Als de computers de betekenis achter de data begrijpen (relaties, beschrijvingen, etc.), dan zijn ze in staat tot het oplossen van ongelofelijk moeilijke vraagstukken. Deze betekenis wordt aangegeven door middel van metadata.
Metadata is data over andere data. De titel‐, artist‐ en albuminformatie op je Ipod is hiervan een voorbeeld. Dublin Core metadata bestaat uit 15 elementen (title, creator, date, etc.) en heeft als voordeel dat het voor alles te gebruiken is (niet alleen voor websites) en dat het uitwisselbaar is met andere standaarden. Alle mogelijke beperkingen werden in dit systeem overwonnen: de set kon makkelijk worden uitgebreid; er werden voor iedereen te begrijpen termen gebruikt; taalbarrières werden overwonnen en het was vooral heel simpel te gebruiken.
De ondergang van Dublin Core
Er zijn verschillende factoren aan te wijzen waardoor dit idee uiteindelijk is mislukt. Elk ander semantisch project heeft dan ook rekening te houden met deze factoren wil het een succes worden.
Geen ondersteuning van marktleider (Google)
Over het algemeen wordt iets alleen een succes als de markt er ook echt iets aan heeft. En laat dat nou net hier niet het geval zijn. Google, de grootste zoekmachine van dit moment, ondersteunt het niet. Daarmee is eigenlijk alles al gezegd, want waarom zou je tijd steken in iets wat toch niet gebruikt wordt door je doelgroep. Het heeft nu gewoon geen zin.
Zolang Google marktleider is zijn er maar weinig redenen voor ontwikkelaars om hun producten semantisch aan te bieden. Google doet het op zijn manier best goed op dit moment en heeft zijn eigen methodes ontwikkeld om websites (semantisch) te indexeren. Elk nieuw semantisch idee kan alleen succesvol worden als het door Google wordt ondersteund, anders is het gedoemd te mislukken.
Semantiek is globaal en niet intern
De Dublin Core set wordt hier en daar toch toegepast. De Nederlandse Overheid bijvoorbeeld heeft het als gevolg van de webrichtlijnen (een aantal richtlijnen waar overheidssites aan moeten voldoen) op een aantal van haar websites staan. De overheid kan op deze manier een mooi intern systeem opzetten. Echter, ‘intern’ gaat totaal in tegen de principes van een semantisch web, dat is bedoeld als een globaal systeem voor iedereen.
Websites zijn niet gemakkelijk in te delen
Er zit een verkeerde gedachte achter het semantische web, namelijk dat alle websites informatief zijn. Je kan een website niet beschrijven zoals je dat met een boek in de bibliotheek zou doen. Voor de doorsnee website is het bijvoorbeeld lastig om de Dublin Core elementen ‘publicatie datum’ of ‘geldigheidsdatum’ te bepalen. En elementen als ‘is versie van’ en ‘is een alternatief voor’ zijn moeilijk te gebruiken. Een website is gewoon geen statisch document.
Zo is het ook bij de in de html specificatie gedefinieerde ‘rel’ attributen. Voorbeelden hiervan zijn ‘start’ ‘next’ ‘prev’ en ‘chapter’. Deze attributen zijn door dezelfde fout ten onder gegaan; dat is ook waarom werkelijk niemand ze nog gebruikt. Neem een webwinkel. Welke pagina kies je als de start van het.. webwinkel’document’? Wat is de volgorde van de pagina’s? De inhoudsopgave? Als je het probeert te implementeren loop je erop stuk dat een website gewoon geen publicatie is die je van voor naar achteren doorleest. Het is een dynamisch geheel waarbij een pagina op allerlei verschillende manieren bij andere pagina’s hoort.
Bijna alle semantische ideëen vandaag de dag zijn gewoon niet bruikbaar. Het werkt niet zolang webpagina’s als statische documenten ingedeeld worden.
Teveel extra code is ongewenst
De Dublin Core elementen worden in het gedeelte van de website code geplaatst. Dit leidt tot een ongelofelijke hoeveelheid data: code bloat. Een grotere bestandsgrootte is het gevolg en het voelt gewoon hinderlijk. Nu de focus steeds meer komt te liggen op betere en schonere code, is code bloat echt not done. Het werkt gewoon niet als er allerlei tags en attributen aan de code toegevoegd moeten worden, de code zelf moet semantisch zijn.
Semantisch werkt niet zonder standaard
Een van de grootste problemen van Dublin Core was toch wel dat er geen standaard bestond voor het invullen van de informatie. Iedereen deed wat hij dacht dat juist was. Als de een als type ‘afbeelding’ invult en de ander ‘plaatje’, weer een ander ‘stilstaand beeld’ en nog een ander ‘image’ (want er zijn natuurlijk ook nog andere talen), dan werkt de hele semantische gedachte niet: er zou één vaststaand woord moeten zijn om een bepaald concept te beschrijven.
Om deze problemen aan te pakken werden ‘vocabularies’ geïntroduceerd. Dit zijn databases met geschikte woorden. Deze databases hebben zo hun eigen problemen. Ten eerste zijn alle woorden in een bepaalde taal (in het geval van Dublin Core alleen in het Engels) waardoor van enige internationalisatie geen sprake meer is. Daarbij komt dat iemand van alle databases op de hoogte moet zijn en de moeite moet nemen om de hele database door te lezen om erachter te komen dat hij beter het woord ‘jong volwassenen’ kan gebruiken dan ‘jongeren’. Wie neemt daar de moeite voor? Tevens is er nu een centrale autoriteit nodig die de vocubalaries opstelt en dit past niet echt bij de gelijkheidscultuur die het internet momenteel is. Daarbij is er totaal geen controle of de gebruikers het wel goed toepassen. Het is eigenlijk gewoon absurd.
Het mag geen moeite kosten
Hoe simpel de Dublin Core set dan ook mag zijn, het is toch teveel werk voor het overgrote deel van de gebruikers. Het kan uren kosten om aan elke pagina de juiste titel, onderwerpen, beschrijving, datum, etc. te geven en er zijn weinig mensen die die tijd ook echt vrijmaken. Als het semantische
web er komt, zal het iets moeten zijn waar de ontwikkelaar weinig moeite voor hoeft te doen. Of nog beter, helemaal geen moeite.
Mensen zijn niet te vertrouwen
Beter vindbaar zijn is voordelig. Zelfs zo voordelig dat persoonlijk gewin een rol gaat spelen. En dat is nou juist waar het fout gaat. Bij de Dublin Core set zijn de gebruikers zelf verantwoordelijk voor het juist en objectief invullen van de gegevens, een vrijbriefje voor manipulatie en zoekwoord‐spamming. Zolang gebruikers voor persoonlijk gewin gaan zal het systeem daar altijd door beïnvloed worden. Mensen zullen er alles aan doen om zelf beter vindbaar te zijn. Een semantisch idee heeft er dus voor te zorgen dat het niet ten onder gaat aan zijn eigen gebruikers.
Te simpel werkt averechts
Al snel na de introductie van Dublin Core bleek dat het uitwisselen van de data toch niet zo gemakkelijk werkte. De set was te simpel in vergelijking met andere systemen. Bij het omzetten ging er allerlei belangrijke informatie verloren. Er was gewoonweg geen manier om deze informatie te verwerken. Een semantisch systeem moet deze ingewikkelde dingen aan kunnen.
Het grote publiek laat het links liggen
Voor het overgrote deel van de ontwikkelaars is semantiek nog een ver‐van‐mijn‐bed‐show. Zowel het probleem als de oplossing voor het probleem is niet duidelijk. Want wat is er eigenlijk mis met de huidige situatie? Zodoende is er gewoon geen beangstelling voor. Daarbij komt dat de organisaties die semantiek moeten promoten erg stoffig zijn en totaal geen kaas hebben gegeten van goede marketing. Neem het W3C. Ze hebben nog steeds bijna niemand overtuigd van het nut van valide code. Als zoiets kleins al niet lukt, hoe zou het dan vergaan met iets groots als het semantische web?
Kortom
Het semantische web heeft met een aantal barièrres te kampen. Barièrres die op dit moment nog niet zo gemakkelijk te overwinnen zijn. Dat het semantisch web voor iedereen een ontzettende vooruitgang zou betekenen is een feit, maar op dit moment is het praktisch gewoon nog niet haalbaar.
Is er nog hoop?
Is Dublin Core nog te redden? Ik weet het niet. Ik kan geen oplossing bedenken. Mijn mening is dat Dublin Core gewoon mislukt is en dat was het dan. Een leuk project, maar uiteindelijk niet haalbaar. Hoe denk jij over de toekomst van Dublin Core en het semantische web?
Over de auteur
Daan Walraven
Daan Walraven zorgt ervoor dat websites er niet alleen mooi uitzien, maar ook nog de nodige doelen behalen.
| Website | http://www.daanwalraven.nl/ |



