Steeds meer CMSen zijn gebaseerd op XML en intra- en internetsites moeten voldoen aan de door de W3C opgestelde webstandaarden. Bovendien heeft de overheid, om de kwaliteit en toegankelijkheid van websites te verbeteren, in 2004 specifiek webrichtlijnen opgesteld voor overheidswebsites.
Opschonen bestaat feitelijk uit twee onderdelen. Het opschonen van de inhoud van de content, bijvoorbeeld het omzetten van HTML naar XHTML zodat het voldoet aan de eisen van het nieuwe CMS en als tweede het opschonen van het contentset aan de hand van de mappingregels. Dit houdt in dat bijvoorbeeld nieuwsberichten voor 2002 niet worden gemigreerd of dat de pagina’s met minder dan 10 pageviews in jaar worden overgeslagen.
Beide onderdelen zullen in het migratie framework moeten worden geconfigureerd.
Aan de hand van onderstaand stappenschema wordt content opgeschoond.