Opschoning
Steeds meer CMSen zijn gebaseerd op XML en intra- en internetsites moeten voldoen aan de door de W3C opgestelde webstandaarden. Bovendien heeft de overheid, om de kwaliteit en toegankelijkheid van websites te verbeteren, in 2004 specifiek webrichtlijnen opgesteld voor overheidswebsites.
Een schone start
Opschonen bestaat feitelijk uit twee onderdelen. Het opschonen van de inhoud van de content, bijvoorbeeld het omzetten van HTML naar XHTML zodat het voldoet aan de eisen van het nieuwe CMS en als tweede het opschonen van het contentset aan de hand van de mappingregels. Dit houdt in dat bijvoorbeeld nieuwsberichten voor 2002 niet worden gemigreerd of dat de pagina’s met minder dan 10 pageviews in jaar worden overgeslagen.
Beide onderdelen zullen in het migratie framework moeten worden geconfigureerd.
Opschonen van de inhoud
Aan de hand van onderstaand stappenschema wordt content opgeschoond.
- Translatie
Omzetten van HTML tags, stijlen en attributen naar de juiste naamgeving en opbouw.
- Verwijderen
Niet toegestane en niet gebruikte tags, scripts en overige code worden verwijderd.
- Transformeren
De XML wordt op basis van transformatieregels omgezet naar door het door het CMS vereiste XML formaat.
- Herstructureren
De webstandaarden en -richtlijnen kennen restricties met de betrekking tot de structuur van een pagina. Denk hierbij bijvoorbeeld aan alinea’s die altijd binnen een bepaalde HTML tag moeten staan.
