KWR

Automatische metadatering is essentiële operatieslag om kenniskloof te overbruggen

‘Bridging Science to Practice’ is het motto van KWR, het Nederlandse instituut voor wateronderzoek. Een van de manieren van KWR om de kennisoverdracht tussen wetenschap en praktijk te vergroten, is het publiceren van de kennis (wetenschappelijke artikelen, rapporten, etc.) in zijn online bibliotheek. “De hoeveelheid content en de hoge snelheid waarmee die wordt aangeboden, is niet altijd geweest wat het nu is”, aldus Jonie Keessen, bibliothecaris bij KWR.

De start van de bouw van het nieuwe kantoor in 2012 werd als psychologisch moment aangegrepen om een digitaliseringsslag door te voeren. “Alle 170 medewerkers zouden in het nieuwe kantoor maximaal één meter boekenplank ter beschikking krijgen en dat was voor veel onderzoekers behoorlijk schrikken. Vanaf dat moment zijn wij documenten die bewaard moesten worden en waarvan wij alleen een hardcopy hadden, gaan scannen en digitaal op gaan slaan in ons centrale ECM-systeem OpenText Content Server, met andere woorden de interne digitale bibliotheek.”

Onvolledige metadata
Nadat alle documenten waren gescand en toegevoegd in de interne digitale bibliotheek was het tijd om de OpenText omgeving verder te optimaliseren. Jonie Keessen legt uit: “De wens was om een koppeling te maken tussen de interne digitale bibliotheek en onze online bibliotheek. Openbare rapporten en artikelen die in de interne digitale bibliotheek worden opgeslagen, worden daarbij automatisch doorgeplaatst op onze online bibliotheek. Dat proces verliep voorheen handmatig.

Om deze documenten doorzoekbaar te maken, moeten zij wel over metadata beschikken.” In de praktijk bleek dat niet alle content in OpenText over voldoende of de juiste metadata beschikte en dus voor gebruikers niet gemakkelijk toegankelijk was. Zo was het bijvoorbeeld onmogelijk om te zoeken op auteur of op combinaties van meerdere woorden. Voor dit project werd de hulp ingeroepen van KBenP in combinatie met Xillio’s platform.

Automatische metadatering
Met name de nieuw gescande bestanden, maar ook zeer oude bestanden uit de jaren ’60 en ’70 werden in het project meegenomen. Met behulp van automatische metadatering werden deze bestanden onder de loep genomen en metadata toegekend, zoals auteur, titel, projectnummer, expertise, opdrachtgever, documentsoort en trefwoorden. 

 

“De moeilijkheid hierbij was dat de oudere bestanden vaak slecht leesbare scans waren en dat de opmaak van de verschillende soorten documenten in de loop der tijd is veranderd”, aldus Jonie Keessen. “Daardoor was het lastig om de documenttypen te herkennen. Zo’n 200 rapporten waren helemaal niet ge-OCR-d en werden zelfs nog tijdens het project ge-OCR-d en toegevoegd.”  

Efficiënter zoekproces
Na drie maanden werd het project in juni 2016 afgerond. Dat was later dan vooraf was ingeschat, maar had te maken met de diversiteit in opmaak van de publicaties door de jaren heen, de vele soorten documenten en de 200 rapporten die nog werden toegevoegd.

Jonie Keessen vertelt over het resultaat: “Na het automatisch toevoegen van de metadata kunnen onze gebruikers veel sneller de benodigde documenten vinden. Het zoekproces is nu veel effectiever. We hebben ook een hele reeks aan oudere documenten via de interne digitale bibliotheek aan de online bibliotheek kunnen toevoegen en daarmee leveren wij nog meer kennis. Tot slot is het achterliggende proces sterk verbeterd. Waar ik vroeger publicaties handmatig doorstuurde naar Communicatie die ze toevoegde aan de online bibliotheek, verloopt dit nu automatisch door de koppeling tussen de interne digitale bibliotheek en de online bibliotheek.”

Continue verbetering
Om ervoor te zorgen dat nieuwe publicaties goed vindbaar zijn, voegen projectmanagers bij de start van een project zoveel mogelijk metadata toe in het financiële systeem (AllSolutions). Vervolgens wordt er automatisch in OpenText CS een projectmap aangemaakt. Vergaderstukken en concept-publicaties in deze map krijgen automatisch de metadata van het betreffende project.

Onderzoekers sturen nu nog hun definitieve publicaties, zoals bijvoorbeeld wetenschappelijke artikelen, per e-mail naar Jonie, die ze vervolgens toevoegd aan de interne digitale bibliotheek. Op hetzelfde moment worden de publicaties die openbaar zijn automatisch doorgezet naar de online bibliotheek. Deze stap wordt momenteel verder geautomatiseerd door middel van een workflow. De publicaties hoeven dan niet meer rondgemaild te worden. Zo kan KWR ondanks een kleine overhead efficiënt kennis delen met de wereld.

 

Download case

"Na het automatisch toevoegen van de metadata kunnen onze gebruikers veel sneller de benodigde documenten vinden. Het zoekproces is nu veel effectiever."

Jonie Keessen
- Bibliothecaris bij KWR