Het belang van data literacy, ofwel de vaardigheid om wetenschappelijke data te begrijpen, (her-)gebruiken en te beheren,* is zowel onder wetenschappers als informatieprofessionals onvoldoende bekend. Sprekers op de IFLA-conferentie, die van 10 tot en met 15 augustus plaatsvond in Götenborg, struikelden bijna over elkaar heen om deze boodschap te verkondigen. Hier ligt een (nieuwe) taak, die onze aandacht verdient.
(Verschenen in Informatie Professional, 09/2010 p. 10-11. Ook: http://www.informatieprofessional.nl/bijdragen/8153.html )
In de exacte, medische en technische wetenschappen werken vaak meerdere wetenschappers aan één onderzoek en is het (her-)gebruik van elkaars data aan de orde van de dag. Maar in de sociale wetenschappen zijn zowel studenten als wetenschappers erg ‘data illiterate’, zo bleek tijdens de IFLA-sessie ‘Users driving access and services. Making it count, social science data literacy as an information fluency’. Daarmee wil niet gezegd zijn dat ze niet heel goed zouden zijn in het verzamelen van data. Dat is hun vak en daar ging deze sessie niet over. De sprekers constateerden dat wetenschappers met name tekortschieten als het gaat om het zoeken naar beschikbare datasets en het beschikbaar stellen aan derden van geordende en beschreven verzameling onderzoeksgegevens (datasets) die zij zelf hebben verzameld.
In tegenstelling tot literatuuronderzoek lijkt vrijwel geen sociaal wetenschapper vooraf onderzoek te doen naar beschikbare datasets die relevant kunnen zijn voor het onderwerp van onderzoek, zo bleek uit de lezingen. Wetenschappers blijken veelal onbekend te zijn met het bestaan van repositories van datasets. Wellicht als gevolg hiervan rekenen bibliothecarissen het vaak (nog) niet tot hun taak om datasets beschikbaar te stellen of er aandacht aan te besteden in de bibliotheekintroducties of lessen informatievaardigheden.
Hergebruik
Daar ligt een eerste belangrijke taak voor informatieprofessionals, die we moeten oppikken, aldus de sprekers en die mening deel ik, zeker na het lezen van de verschillende papers hierover. Succesvolle initiatieven van dataverzamelingen die beschikbaar zijn voor hergebruik waar we wetenschappers naar kunnen verwijzen zijn het inter-university consortium for political and social research (www.icpsr.umich.edu) bij de University of Michigan, de Bodleian Social Science Library (www.ssl.ox.ac.uk/data.html) in Oxford university en uiteraard onze eigen DANS (www.dans.knaw.nl) waar datasets beschikbaar worden gesteld op het terrein van de sociale wetenschappen. Aan ons de taak dus om, vergelijkbaar met informatievaardigheden, de studenten en wetenschappers vaardig te maken op het zoeken naar en evalueren van de juiste onderzoeksgegevens.
Veiligstellen
Het tweede domein waar bibliothecarissen actief moeten worden is het verzamelen en veiligstellen van datasets die door de onderzoekers van de eigen instelling zijn gecreëerd. De sprekers gaven talloze voorbeelden van wetenschappers die vele maanden veldwerk ‘ergens’ op hun computer moesten hebben, maar niet in staat waren deze terug te vinden. Als de onderzoeksgegevens al gevonden werden, waren er vaak geen deugdelijke back-ups, of waren zij opgeslagen op media die niet meer leesbaar waren, zoals floppy disks of zipdrives. Bibliotheken zouden actief datasets bij wetenschappers moeten verzamelen, deze in veilige repositories opslaan, metadateren en ontsluiten, en vervolgens beschikbaar stellen binnen de eigen organisatie en zoveel mogelijk ook daarbuiten in Open Access.
‘Out of the closet’
Uit de vragen die in de discussie werden gesteld, bleek dat het publiek de mening van de sprekers weliswaar deelde, maar zich vooral afvroeg hoe dit te bewerkstelligen, omdat in de praktijk blijkt dat de sociaal wetenschappers ‘nogal op hun data zitten’. ‘Librarians get your social science data out of the closet,’ aldus iemand uit het publiek.
Aan ons bibliothecarissen dus de taak om de wetenschappers te bevrijden van hun data door deze beschikbaar te stellen en doorzoekbaar te maken voor hergebruik. Bijzondere aandacht zou moeten worden besteed aan dataverzamelingen uit kwalitatief onderzoek, dat zo typerend is voor de sociale wetenschap.
De lezingen zijn te vinden op tinyurl.com/286trg2 onder sessie 86
* Naar: Jian Qin and John D’Ignazioy: Lessons learned from a two-year experience in science data literacy education (tinyurl.com/2b3tg3q, accessed 17 augustus 2010)