Wat is Content ETL?

Extraction, Transformation en Load, afgekort ETL, is een begrip uit de informatica en wordt traditioneel toegepast op gestructureerde data. Het benoemt de processen die gebruikt worden om gegevens uit verschillende gestructureerde databases te verenigen in een andere database, veelal een datawarehouse. Meer over ETL.

Het begrip Content ETL is recentelijk ge├»ntroduceerd en wordt toegepast op ongestructureerde data, zoals aanwezig op filesystemen, ECM, WCM en DM-systemen. Content ETL benoemt de processen die worden ingezet om documenten/content eenvoudig tussen verschillende content systemen/repositories uit te wisselen. Het ETL (extraheren, transformeren en laden) proces is voor ongestructureerde data veel lastiger dan gestructureerde data. Dat heeft een aantal oorzaken.  

Wat is het nut van Content ETL?

Content ETL wordt voor diverse doeleinden ingezet, te weten:

  • Voor compliance: Bijhouden van audittrail en Access Control List (ACL) en kunnen toetsen aan wet- en regelgeving als het gaat om ongestructureerde content.
  • Voor integratie-, migratie-, en conversietrajecten: Met uitgebreide metadata en classificatie is het mogelijk om ongestructureerde data uit bronsystemen eenvoudig te migreren/converteren naar een nieuw doelsysteem.
  • Data fit: Zorgen voor een betere fit van data met de functionaliteit van het nieuwe ECM- of DM-systeem.