'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Moderator: Astro

Reageer
Gebruikersavatar
Berichten: 128

'Wetenschappelijke gegevens gaan in hoog tempo verloren'

http://www.nature.co...lishing%20Group

Decline can mean 80% of data are unavailable after 20 years.


Afbeelding


In their parents' attic, in boxes in the garage, or stored on now-defunct floppy disks — these are just some of the inaccessible places in which scientists have admitted to keeping their old research data. Such practices mean that data are being lost to science at a rapid rate, a study has now found.


The authors of the study, which is published today in Current Biology1, looked for the data behind 516 ecology papers published between 1991 and 2011. The researchers selected studies that involved measuring characteristics associated with the size and form of plants and animals, something that has been done in the same way for decades. By contacting the authors of the papers, they found that, whereas data for almost all studies published just two years ago were still accessible, the chance of them being so fell by 17% per year. Availability dropped to as little as 20% for research from the early 1990s.


“Most of the time, researchers said ‘it’s probably in this or that location’, such as their parents' attic, or on a zip drive for which they haven’t seen the hardware in 15 years," says Timothy Vines, the lead author on the study and an evolutionary ecologist at the University of British Columbia in Vancouver. "In theory, the data still exist, but the time and effort required by the researcher to get them to you is prohibitive.”


Another challenge was simply tracking down authors and receiving a response, something at which the team was successful in just 37% of cases. The likelihood of being able to find a working e-mail address, even after an extensive online search, declined by 7% per year. Meanwhile, only around half of the authors with valid addresses responded to the requests, however old the paper.




A role for journals


Matthew Woollard, director of the UK Data Archive in Colchester, cautions that the analysis does not take into account the size of the individual data sets, nor whether the data were held by institutions. "In the late 1990s or even early 2000s, much larger data sets would be more unlikely to end up in personal collections and so, possibly, have a higher chance of being kept institutionally," he says.


But overall, Woollard says, the results are broadly what he would expect across disciplines. The study's authors argue that journals are in the best position to do something about this. Demanding that authors submit their data to a public archive as a condition of publication could have a huge impact, says Vines, who is a managing editor of Molecular Ecology, a journal that introduced this policy two years ago. “It’s a very easy thing for journals to do, and I think it would dramatically improve the quality and quantity of data that are archived."


Nature requires authors to make data “promptly available to readers without undue qualifications” and to disclose restrictions upon submission. Some types of data, such as DNA sequences, must be submitted to a community-endorsed public repository. For other kinds of data, where public repositories are less developed, this is “strongly recommended”.


Although discipline-specific archives are making it easier for scientists to preserve and share their data, they are currently used by only a small number of eager early-adopters, says Michael Hildreth, a physicist at the University of Notre Dame in Indiana and leader of the US-government-funded Data and Software Preservation for Open Science. But as the tools to explore them and link data together are developed, they could become powerful ways to both organize and preserve data, he adds.

However, a survey presented at the International Congress on Peer Review and Biomedical Publication in Chicago, Illinois, in September found that researchers might be becoming more reluctant, not less, to share their data — at least in medical research. A survey of authors publishing in the Annals of Internal Medicine between 2008 and 2012 found that their willingness to share their data decreased from 62% to 47% over the period.




Irretrievable


Despite Vines' concern that allowing valuable data to disappear is crazy, tales of research data being lost to history are all too common. Agricultural researcher Melvin McCarty, for instance, spent 15 years between 1958 and 1973 recording the life cycles of plants and grasses near Lincoln, Nebraska. Forty years later, ecologist Lizzie Wolkovich went searching for McCarty’s data as part of an effort to tie together experiments exploring how rising temperatures affect plant life cycles. But McCarty had died, and his raw data could not be found. “There is nothing we can replicate now. The loss of the long-term data set is very sad,” says Wolkovich, who works at the University of British Columbia in Vancouver.


A similar fate befell the raw data collected in the 1980s by Otto Solbrig, a biologist at Harvard University in Cambridge, Massachusetts, on species of violets in New England. Plant biologist Sydne Record at Michigan State University in East Lansing wrote to him in 2009 asking for the original data, to test out a mathematical analysis of population viability that she was developing — but Solbrig didn’t have them. “We had at least 20 big folders with those data, but nobody was interested in them so we threw them away,” he says.


Nature doi:10.1038/nature.2013.14416

Berichten: 12.262

Re: 'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Ik vrees dat dat nog wel ff zal doorgaan ook, als je bekijkt hoeveel ruwe data er op papiertjes en dergelijke genoteerd wordt. Dat blijven vaak hele labjournaals vol, en die worden niet compleet gedigitaliseert. Wellicht wel de data die voor een publicatie wordt gebruikt (ook de ruwe data, "ergens" op het systeem van een universiteit, of erger, op een laptop van een onderzoeker).


Het zou een goede zaak zijn als men ruwe data mee kon publiceren met het artikel, waarbij die ruwe data dan "verplicht" opgeslagen wordt op de server van het journal waar men de publicatie zelf kan inzien. Gezien de immer groeiende opslagcapaciteit per euro/dollar moet het mogelijk zijn dat zonder exorbitante kosten te doen.
Victory through technology

Gebruikersavatar
Berichten: 128

Re: 'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Toen ik in een academisch ziekenhuis stage liep was het verplicht om alle informatie op de groepsschijven te bewaren. Laptops waren niet toegestaan. Dit was eigenlijk vanwege patiënt privacy maar het helpt ook om verlies van data te voorkomen.


Soms worden de meest nutteloze dingen wél bewaard. Ik kwam nog een overbodig memo briefje tegen op een flowkast die ik er jaren geleden op had gehangen :roll: Mensen zijn als de dood om iets belangrijks weg te gooien, als een resultaat liggen de vriezers ook vol met oude troep.


However, a survey presented at the International Congress on Peer Review and Biomedical Publication in Chicago, Illinois, in September found that researchers might be becoming more reluctant, not less, to share their data — at least in medical research. A survey of authors publishing in the Annals of Internal Medicine between 2008 and 2012 found that their willingness to share their data decreased from 62% to 47% over the period.


Onder medische onderzoekers is er steeds minder geld te verdelen. Dus wordt er flink om gevochten. Het is triest, maar als je medische onderzoekers niet iets terug kunt bieden dan zullen velen (de meesten?) weigeren om iets te geven.

Berichten: 12.262

Re: 'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Die vriezers vol is inderdaad wel een bekend fenomeen, in ieder geval in biochemische/medische hoek. Doosjes vol samples van mensen die al zeker 10 jaar geleden gepromoveerd en vertrokken waren - welliswaar met inhoud en iets van een opschrift (vaak een nummer oid). Eigenlijk is dat ook verloren data, niemand die meer weet wat dat opschrift betekent :)


Ik vraag me af wanneer zoiets wordt weggegooid: waarschijnlijk pas bij een verhuizing, tot die tijd is een extra -80 kopen vaak goedkoper dan de huidige voorraad uitpluizen.
Victory through technology

Gebruikersavatar
Berichten: 128

Re: 'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Er schijnt een professor te zijn geweest die wat van zijn eigen samples aantrof van circa 30 jaar geleden :) Inderdaad wordt er gewoon een nieuwe vriezer neergezet als de oude vol zijn. Maar aan stroom moeten die dingen ook flink kosten..


Er zou verplicht een label format moeten worden ingevoerd met bv barcodes voor het kleine grut, en verplichte invoer in een computer systeem wat alle deponeurs om de 5 jaar een herinneringmailtje stuurt. Wellicht dat registratie van samples in de toekomst automatisch optreedt via RFID lezertjes in de vriezer.

Berichten: 12.262

Re: 'Wetenschappelijke gegevens gaan in hoog tempo verloren'

Dat zou zeker helpen. Veel samples in vriezers zitten in kleine volumes - epjes of potjes met een septum met een inhoud van 1 of een paar ml. Die zijn echter groot genoeg om gewoon een labeltje met een barcode op te plakken dat je kunt uitdraaien met een labelprinter van een paar tientjes.


Het zou voor laboratoria een goede zaak zijn als er bij iedere ruimte met vriezers een systeem hing waarbij je even moet invullen/scannen wie je bent en kort moet intikken wat het sample is, zodat je er een barcode op kunt plakken alvorens het in te vriezen.


Ik heb ook talloze schijnbaar lege potjes in de -80s gegooid onder het mom van 'misschien moeten we er nog eens wat aan meten'. Vaak milli of microgrammen van bijv vetzuur derivaten waar het oplosmiddel vanaf gedampt was, zodat het feitelijk sample weinig meer is dan een 'vlekje' aan de binnenkant van zo'n potje. Het zou me niet verbazen als die samples nu nog ergens in de vriezer van de vakgroep liggen, al dan niet voorzien van een cryptisch opschrift (15H-ANA oid) met een watervaste stift ;)
Victory through technology

Reageer