Digitale Werkzeuge bieten immer mehr Möglichkeiten für eine kollaborative Wissenschaft zur Bewältigung globaler Herausforderungen. Doch allzu oft bleiben den Forschern die wertvollen Daten, die für diese Arbeit erforderlich sind, verschlossen.
Daten können in einer nicht durchsuchbaren Sammlung vergraben sein, mit eigentümlicher Terminologie kodiert sein oder auf eine Art und Weise, die sich nicht ohne weiteres mit anderen Daten verarbeiten lässt – oder nicht ohne weiteres nutzbar sein, weil Wissenschaftler Einzelheiten über die Daten selbst, etwa ihren Ursprung oder ihre Nutzungsbedingungen, nicht überprüfen können.
„Das ist ein Problem, das eigentlich so alt ist wie die Wissenschaft selbst“, erklärt Simon Hodson, der Geschäftsführer der Ausschuss für Daten (CODATA) des International Science Council (ISC), dessen Ziel darin besteht, die Verfügbarkeit und Nutzbarkeit von Daten zu verbessern.
Diese Datenprobleme können Forschungsmöglichkeiten einschränken und Zeit und Geld verschwenden. Forschungsprojekte Laut der 2018 von der Europäischen Kommission veröffentlichten Studie ist die Bereinigung qualitativ schlechter Daten, um sie nutzbar zu machen, bei weitem die zeitaufwändigste Aufgabe eines durchschnittlichen Datenanalyseprojekts und kann 80 % des Gesamtaufwands ausmachen.
Die WeltFAIR Das Projekt, eine Zusammenarbeit zwischen CODATA und dem International Science Council (ISC), hat sich dieses Problems angenommen. Ziel des Projekts war es, „Daten nutzbar zu machen“, indem die Einführung der FAIR (Findable, Accessible, Interoperable, Reusable) Datenprinzipien, die ein besseres Datenmanagement und eine durch maschinengestützte Analysen unterstützte Forschung fördern.
Mit dem Abschluss des Projekts möchte CODATA die Initiative fortsetzen und ausbauen mit WeltFAIR+, das neue Partner und internationale Fallstudien einbezieht, in denen die im zweijährigen WorldFAIR-Projekt gewonnenen Erkenntnisse in die Praxis umgesetzt werden.
Die neue Phase wird als „Föderation“ von Projekten strukturiert sein und einen Rahmen für die Zusammenarbeit bieten, in dem Wissenschaftler technisches Fachwissen austauschen und auf der Arbeit der anderen aufbauen können. CODATA lädt potenzielle Partner ein, Fallstudien vorzuschlagen und sich zu beteiligen.
Die ersten Arbeiten von CODATA, die die Grundlage für WorldFAIR bildeten, begannen 2017 mit Unterstützung des ISC und Mitteln des Chinesische Vereinigung für Wissenschaft und Technologie. Zu dieser vorbereitenden Arbeit gehörten Workshops, die zur Entwicklung von drei Fallstudien führten, die sich jeweils auf die Datennutzung in einem bestimmten Bereich konzentrierten: Infektionskrankheiten, Stadtplanung und Katastrophenvorsorge. In der Anfangsphase des Projekts entwickelte CODATA auch eine wichtige Partnerschaft mit der Data Documentation Initiative (DDI).
Aufbauend auf diesen Bemühungen sicherte sich CODATA Förderung durch die Europäische Kommission für WorldFAIR. Das Projekt unterstützte 11 Fallstudien, die die Datennutzung in einer Vielzahl von Bereichen untersuchten – darunter kulturelles Erbe, Nanomaterialien und Meereswissenschaften. Die Fallstudien erstreckten sich auf 13 Länder, darunter Brasilien, Kenia, Neuseeland und die USA
Die im Projekt gewonnenen Erkenntnisse bildeten die Grundlage für 11 Richtlinien empfehlungen Verbesserung der Nutzung und Verfügbarkeit von Daten für die Wissenschaft und führte zur Entwicklung der Rahmen für domänenübergreifende Interoperabilität (CDIF), dessen Ziel darin besteht, die Interoperabilität von Daten aus verschiedenen wissenschaftlichen Bereichen zu verbessern.
Gleichzeitig veröffentlichte CODATA neue Terminologie des Forschungsdatenmanagements, das klare Definitionen der in diesem Bereich verwendeten Begriffe liefert; diese Begriffe wurden nun als maschinenlesbare „FAIR-Vokabular“ und wird bald in einem für Menschen besser lesbaren Format online verfügbar sein.
Jede der 11 Fallstudien generierte zudem ihre eigenen Berichte und Anleitungen für die Datennutzung mit dem Ziel, Empfehlungen abzugeben, die für verschiedene Wissenschaftsbereiche relevant sind.
Eine der Fallstudien befasste sich mit landwirtschaftliche Biodiversität, mit Schwerpunkt auf Bestäubung – einem Bereich, in dem das Modell zur Beschreibung und Kategorisierung von Daten noch definiert wird. Aufbauend auf Daten und Beiträgen von Kollegen aus aller Welt entwickelten Forscher aus einem halben Dutzend Ländern – Brasilien, Kenia, Argentinien, den USA, Großbritannien und den Niederlanden – ein Umfassende Anleitung und Werkzeugsatz für Daten zur Interaktion zwischen Pflanzen und Bestäubern.
Es handelt sich zwar um ein äußerst spezielles Thema, das jedoch für Wissenschaftler in den unterschiedlichsten Bereichen nahezu überall relevant ist. Diese können nun von einem einheitlichen, standardisierten Verfahren zum Umgang mit den Daten profitieren, das es ihnen erleichtert, auf der Arbeit von Kollegen aufzubauen und ihre eigene Forschung zu beschleunigen.
„Der Übergang von unterschiedlichen Ansätzen und isolierten Initiativen zu allgemein verfügbaren FAIR-Daten über Wechselwirkungen zwischen Pflanzen und Bestäubung für Wissenschaftler und Entscheidungsträger wird die Entwicklung integrativer Studien ermöglichen, die unser Verständnis der Biologie, des Verhaltens, der Ökologie, der Phänologie und der Evolution von Arten verbessern“, schreiben Forscher, die an der Fallstudie gearbeitet haben.
In einer anderen Fallstudie untersuchten die Forscher Katastrophenvorsorge„Da der Klimawandel und die Bevölkerungszunahme voraussichtlich sowohl die Schwere als auch die Häufigkeit von Katastrophen erhöhen werden, wird es für unsere Reaktionen immer wichtiger, über zuverlässige Daten zu verfügen“, schreiben sie.
Wissenschaftler sowie nationale und internationale Organisationen, die sich mit Katastrophenrisiken befassen, blicken in die Vergangenheit, um die Auswirkungen möglicher zukünftiger Ereignisse abzuschätzen und zu verstehen, wie man sie im Nachhinein eindämmen und bewältigen kann. Sie greifen dabei auch auf Daten zurück, die ständig von Sensoren auf der Erde und von Satelliten öffentlicher und privater Seite geliefert werden.
Doch in der Fallstudie war es für die Forscher schwierig, die Informationen zu erhalten, die für genaue Einschätzungen erforderlich sind, da viele der relevanten Daten nicht den FAIR-Datenprinzipien entsprechen. Oft fehlen wichtige Informationen – etwa die Zahl der Verletzten bei einer Katastrophe oder wie schnell sich das Ereignis entwickelt hat. In anderen Fällen verwenden nationale Behörden ihre eigenen Methoden, um wichtige Datenpunkte zu berechnen, ohne ihre Arbeit offenzulegen, was einen Vergleich für andere erschwert.
Auf der Grundlage seiner umfangreichen Forschungsarbeiten formulierte das Fallstudienteam eine Reihe von Praxisempfehlungen, die es einfacher machen sollen, in diesem zunehmend dringlichen Bereich evidenzbasierte politische Entscheidungen zu treffen – „ein grundlegender Schritt hin zum Aufbau sichererer, widerstandsfähigerer Gemeinschaften und Nationen“, schreiben sie.
Forscher der International Union of Pure and Applied Chemistry (IUPAC) untersuchte in einer Fallstudie, wie sich Daten und Terminologie rund um Chemikalien für Mensch und Maschine leichter nutzbar machen lassen.
Die IUPAC hat mehr als ein Jahrhundert Erfahrung Chemiker zusammenzubringen, um die Art und Weise zu definieren und zu standardisieren, wie Wissenschaftler auf diesem Gebiet mit Chemikalien arbeiten und über sie sprechen. Doch da digitale Werkzeuge – und zunehmend KI und verwandte Technologien – neue Arbeitsweisen ermöglichen, untersuchte die IUPAC-Fallstudie, wie diese Standards effizienter gestaltet werden könnten und wie die Wiederverwendung chemischer Daten für andere Wissenschaftler erleichtert werden könnte.
Eines der Produkte der Fallstudie war ein „Kochbuch“, eine offene Ressource mit Richtlinien, die Wissenschaftlern – darunter Studenten, Lehrern und Berufstätigen – dabei helfen sollen, den Umgang mit Chemiedaten zu verstehen und ihre eigenen Daten anderen zugänglicher zu machen.
Das Projekt beschrieb außerdem ein ehrgeiziges neues offenes digitales Protokoll, das viele verschiedene globale Chemiedatenbanken miteinander verbinden könnte, sodass Wissenschaftler mit einer einzigen Abfrage Daten finden und darauf zugreifen – und gleichermaßen prüfen könnten, ob ihre eigenen Daten maschinenlesbar sind.
Wissenschaftler zusammenzubringen, um über die von ihnen produzierten Daten zu sprechen und zu versuchen zu verstehen, wie andere mit ihren eigenen Daten arbeiten, sei augenöffnend gewesen, erklärt Hodson.
Und indem sie klare Standards und Definitionen festlegen, unterstützen Wissenschaftler nicht nur die aktuelle Forschung, sondern machen es auch nachfolgenden Generationen leichter, auf ihrer Arbeit aufzubauen – vielleicht auf eine Art und Weise, die den ursprünglichen Autoren nie in den Sinn gekommen wäre, fügt er hinzu.
„Bei WorldFAIR haben wir festgestellt, wie faszinierend und nützlich es einfach war, diese Gespräche zu führen, alle Fallstudien in einem Raum zu versammeln und sie über ihre Daten sprechen zu lassen, was sie tun, wie diese funktionieren und wie sie sie beschreiben – und in einigen Fällen Verbindungen zu erkennen, an die wir im Vorfeld nicht unbedingt gedacht hatten“, sagt er.
Bild von Taylor Wick on Unsplash.
Haftungsausschluss
Die in unseren Gastblogs präsentierten Informationen, Meinungen und Empfehlungen sind die der einzelnen Autoren und spiegeln nicht unbedingt die Werte und Überzeugungen des International Science Council wider.