Skip to main navigation Skip to main content Skip to page footer

FDM in den Biowissenschaften

Die Biowissenschaften, eine zusammenfassende Bezeichnung für die Biologie als klassische Wissenschaft der Lebewesen, erforschen Prozessen oder Strukturen von Lebewesen selbst sowie Prozesse und Strukturen, an denen Lebewesen beteiligt sind. Biowissenschaftliche Forschung ist häufig interdisziplinär: Zum einen wegen einer häufigen Verschmelzung mit anderen Naturwissenschaften aufgrund der häufig schwierig definierbaren Grenzen infolge eines engen Austauschs zwischen den Disziplinen (Biochemie, Biogeochemie, Biogeographie, Biomedizin, Biophysik, …). Zum anderen werden biologische Erkenntnisse und Methoden häufig auch in weiteren Forschungszweigen anwendungsorientierter biologischer Forschung technisch genutzt und umgesetzt (z. B. Bioinformatik, Bionik, Biotechnologie). Entsprechend divers und komplex sind die in den Biowissenschaften erzeugten Daten. In den Biowissenschaften können sowohl physische Objekte als auch digitale Einheiten Forschungsdaten sein.

Orientierung beim Umgang mit Forschungsdaten bieten die Leitlinien der DFG sowie besonders für die Biodiversitätsforschung der Kodex für Biodiversitätsdaten.

Es gibt vielfältige Anlaufstellen für Fragen des Forschungsdatenmanagements (FDM) in den Biowissenschaften. Wichtige Ansprechpartner für sämtliche FDM-Aspekte in den Biowissenschaften sind die folgenden Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI): 

Zahlreiche diese Konsortien bieten Helpdesks an, an die man sich bei FDM-bezogen Fragen wenden kann:

Nicht immer ist klar ersichtlich, in welche der Disziplinen die eigene Forschung, die eigenen Daten oder die damit verbundene Fragestellung fällt. In diesen Fällen kann man sich an das Beratenden-Netzwerk der lebenswissenschaftlichen Konsortien wenden: Im Geo-Chem-Life Science Helpdesk Cluster haben sich diverse Konsortien in einem Beratungsnetzwerk zusammengeschlossen, um solche Grenz- oder Interdisziplinären Fragen besser beantworten zu können.

Abseits der NFDI bietet GFBio – Gesellschaft für Biologische Daten e.V. Beratung rund um die Themen des biologiebezogenen Datenmanagements im Verbund mit verschiedenen spezialisierten Datenzentren an. Der GFBio Helpdesk kann über die Webseite erreicht werden. Weitreichende Informationen und Beratung zum Management naturkundlicher Sammlungen gibt es über den Helpdesk des Datenkompetenzzentrum WiNoDa. Der Fachinformationsdienst BioFID stellt ferner Literatur zur Biodiversität zur Verfügung.

Im Weiteren stellen wir Ihnen Angebote und Services im Bereich des biowissenschaftlich bezogenen Forschungsdatenmanagements vor. Ihnen fehlt ein Angebot? Sie finden Zusammenhänge nicht ganz richtig dargestellt oder haben Fragen? Wir freuen uns auf Ihre Mail.

Informieren und Planen

Zur Erstellung biowissenschaftsbezogener Datenmanagementpläne (DMP) stellen die NFDI-Konsortien, FAIRagro, NFDI4BIOIMAGE, NFDI4Health und NFDI4Microbiota im Rahmen des Basisdienstes DMP4NFDI einen webbasierten DMP-Dienst zur Verfügung. Dieser basiert auf der Software RDMO (Research Data Management Organizer). Mit dem DataPlan Wizard stellt das Konsortium DataPlant ferner ein eigenes Tool zur Verfügung. Auch die GFBio stellt ein biowissenschaftsbezogenes DMP-Tool als Online-Dienst mit optionaler individueller Beratung zur Verfügung. Darüber hinaus stellt ELIXIR zur Erstellung biowissenschaftsbezogener DMPs den Data Stewardship Wizard zur Verfügung. Des Weiteren bietet ELIXIR mit dem RDM Kit eine umfassende Knowledge Base rund um die Lebenwissenschaften.

Organisieren und Aufbereiten

Je nach Datensatz und Forschungskontext variieren die FDM-bezogenen Anforderungen an das Organisieren und Aufbereiten biowissenschaftsbezogener Daten. Entsprechend gibt es verschiedene Angebote:

Datenmanagement heterogener Daten: Der durch DataPlant entwickelte Annotated Research Context (ARC) erlaubt das Organisieren, Strukturieren sowie die standardisierte Beschreibung von Daten als Fair Digital Objects und bietet eine umfassende (Trainings)dokumentation an.

Datenmanagement von Biodiversitäts- und Umweltdaten: BeXis2 wurde explizit für das Management von Biodiversitätsdaten in Arbeitsgruppen oder kollaborativen Projekten entwickelt.

Bilddaten: Biigle ist ein Web-basiertes Tool zum Annotieren von Bild- und Videodaten.

Mikroskopiedaten: OMERO (Open Microscopy Environment Remote Objects) ist eine offene Client-Server-Plattform zur Speicherung, Verwaltung, Metadatenannotation und Teilen von Mikroskopiedaten.

Beschreiben und Dokumentieren

Ein gängiges Tool zur Dokumentation von Forschungsdaten im Bereich der Biowissenschaften sind Elektronische Laborbücher. Weitere Informationen hierzu finden Sie auf unserer Themenseite zu Elektronischen Laborbüchern.

Im Folgenden finden Sie relevante fachlich einschlägige Metadatenstandards und -schemata:

Darwin Core ist ein von der Darwin Core Maintenance Group gepflegter Standard. Er umfasst ein Glossar von Begriffen, die den Austausch von Informationen über die biologische Vielfalt durch die Bereitstellung von Identifikatoren, Bezeichnungen und Definitionen erleichtern sollen. Darwin Core basiert in erster Linie auf Taxa, deren Vorkommen in der Natur durch Beobachtungen, Exemplare, Proben und zugehörige Informationen dokumentiert ist.

MIxS (Minimum Information about Any Sequence) kann zur Erstellung von Mindestinformations-Checklisten für die Beschreibung von Sequenzierungsdaten verwendet werden.

Die Ecological Metadata Language (EML) definiert ein umfassendes Vokabular und eine lesbare XML-Markup-Syntax für die Dokumentation von Forschungsdaten. Sie ist in den Geo- und Umweltwissenschaften weit verbreitet.

Recommended Metadata for Biological Images (REMBI) bietet Richtlinien für Metadaten im Bereich Imaging Data. REMBI ist das Ergebnis einer Zusammenarbeit der Bioimaging-Community zur Entwicklung von Metadatenstandards, die die Bilddaten selbst beschreiben; außerdem werden mit unterstützenden Metadaten z.B. die biologische Studie und die Probe beschreiben.

Speichern und Rechnen

Zur Analyse und Speicherung großer Datenmengen gibt es die Möglichkeit, auf externe Cloudprovider zurückzugreifen. Cloud-Instanzen werden auch von Akteuren des deutschen Wissenschaftssystems bereitgestellt. Die deNBI-Cloud, eine Cloud des deutschen Netzwerks für Bioinformatik-Infrastruktur, bietet Rechenkapazitäten für Daten- und rechenintensive Projekte der Lebenswissenschaften. Aruna Engine bietet Speicherplatz und kollaboratives Management heterogener großvolumiger Datensätze.

Veröffentlichen und Archivieren

Das Publizieren von Daten ist in den Biowissenschaften gängig. Entsprechend gibt es ein großes Angebot disziplinspezifischer Repositorien, die zur Veröffentlichung von forschungsbezogenen Daten aus der Biologie genutzt werden können.

Eine Übersicht über fachspezifische und institutionelle Repositorien finden Sie auf re3data:

Weitverbreitete Repositorien sind außerdem:

Bei der Wahl eines geeigneten Repositoriums im Bereich der Biodiversitätsdaten sollte, wenn möglich, darauf geachtet werden, ob das Repositorium mit den für die Communities wichtigen Datenportalen verknüpft ist, wie zum Beispiel GBIF (Global Biodiversity Information Facility) im Bereich der Biodiversitätsdaten. Dies dient dazu, die Daten besser auffindbar zu machen. Um Daten bei GBIF verfügbar zu machen, muss ein geeigneter Publisher gefunden werden. Bei der Suche unterstützt der Helpdesk von NFDI4Biodiversity.

Neben Repositorien können Daten auch in Datenjournalen veröffentlicht werden. Fachspezifische Datenjournale in der Biologie sind z. B. Scientific Data oder das Biodiversity Data Journal.

Beim Publizieren von Daten sollte darauf geachtet werden, dass Dateiformate möglichst offen und nicht proprietär sind, da dies insbesondere hinsichtlich der langfristigen Zugänglichkeit und Nutzbarkeit, der Interoperabilität zwischen verschiedenen Tools und somit der Einhaltung der FAIR-Prinzipien relevant ist. Insbesondere in der biologischen Bildgebung und Mikroskopie wird mit zahlreichen Datenmodalitäten und prorietären Dateiformaten gearbeitet. Hierbei kann die Bibliothek Bio-Formats, als Übersetzungswerkzeug proprietärer Dateiformate in offenes Standardformat, das OME-Datenmodell, wie etwa OME-TIFF oder OME-Zarr, dienen.

Finden und Nachnutzen

Ein wesentliches Motiv des Forschungsdatenmanagements liegt in der Nachnutzbarkeit erhobener Forschungsdaten. Dies ist gerade in den Biowissenschaften von großer Bedeutung: Wie verändern sich Artbestände, Zusammensetzung oder Umgebung über die Zeit oder unter verschiedenen Einflüssen?

Damit bereits erhobene Daten in weiteren Studien nachgenutzt werden können, ist es wichtig, dass sie, unter anderem, (über Repositorien) in Community-genutzten Portalen auffindbar sind:

Rechte und Pflichten

Das Nagoya-Protokoll trat im Oktober 2014 in Kraft und ist ein internationaler rechtlicher Rahmenvertrag für die Regelung von Zugang und Vorteilsausgleich (Access and Benefit-sharing, ABS) und Compliance. Viele Länder haben das Nagoya-Protokoll umgesetzt und regulieren den Zugang zu nicht-menschlichem biologischen Material („genetische Ressourcen“) für Forschungszwecke. Diese Länder erwarten das Teilen von Vorteilen, die aus diesem Nutzen entstehen. Dies wird auch Zugang und Vorteilsausgleich (Access and Benefit-Sharing, ABS) genannt. Forschende im akademischen Bereich brauchen möglicherweise eine ABS Genehmigung und müssen ein Vorteilsausgleichabkommen unterzeichnen. Die EU-Verordnung Nr. 511/2014 erfordert von Forschenden, darunter Grundlagen- und nicht-kommerziell Forschende, dass sie sichergehen, dass ihre Forschung mit dem Nagoya-Protokoll konform ist.

Rechtspodcast NFDI4Biodiversity: Dieser Podcast behandelt rechtliche Rahmenbedingungen und Herausforderungen, die der Verwaltung, Veröffentlichung und Nutzung von Forschungsdaten zugrunde liegen. Der Podcast ist in deutscher Sprache und richtet sich an Datenanbieter:innen und -nutzende (z. B. Forschende, Studierende, institutionelles Personal, Datenzentren), die an den rechtlichen Aspekten der Arbeit mit Daten interessiert sind.

FDM-Projekte

I3D:bio

Information Infrastructure for BioImage Data

Die Mikroskopie umfasst eine Vielzahl von Methoden zur Gewinnung von räumlich und zeitlich hoch aufgelösten Forschungsdaten und kommt in allen Bereichen der Lebenswissenschaften und Medizin zum Einsatz. Verschiedene Verfahren erlauben es, mithilfe von Licht- oder Elektronenstrahlen Bilddaten zu erzeugen. Diese Daten werden als Mikroskopiebilder visualisiert und aus Ihnen können mithilfe von Bildanalyse quantitative Informationen über das Untersuchungsobjekt erhalten werden. Durch die Probenvorbereitung können gezielt bestimmte Strukturen sichtbar gemacht und gemessen werden. Beispielmethoden sind etwa die konfokale Lasermikroskopie mit Fluoreszenszfarbstoffen oder Auflicht- und Durchlichtmikroskopie im Weitfeld mithilfe von verschiedenen Färbeverfahren. Nicht nur liefern Verfahren wie Hochdurchsatzmikroskopie oder spezielle Techniken wie die Lichtblattmikroskopie sehr große Datenmengen. Die entstehenden Bilddateien sind zudem oft komplex strukturiert (4-, 5-, oder mehrdimensional) und können sehr große Einzeldateigrößen erreichen (GB bis TB). Zugleich sind die Dateiformate und Metadaten-Strukturen der verschiedenen Gerätehersteller bis heute wenig standardisiert.

Vor diesem Hintergrund stellt das Forschungsdatenmanagement im Bereich Mikroskopie besondere Herausforderungen and Forschende. Das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt Information Infrastructure for BioImage Data (I3D:bio) befasst sich mit Lösungen für das Management und das Teilen von Forschungsdaten im Bereich Bioimaging. Ein Schwerpunkt des Projekts ist die unterstützte Implementation der offenen Software OMERO (OME Remote Objects), die vom Open Microscopy Environment Consortium (OME) speziell für das Bilddatenmanagement entwickelt wurde. Das Projekt I3D:bio erarbeitet zielgruppengerechte Installationshilfen und unterstützt Partnerinstitutionen an verteilten Standorten in Deutschland bei der Einführung von OMERO. Insbesondere die Lichtmikroskopie-Gerätezentren sollen auf diese Weise ihre Nutzenden besser beim Bilddatenmanagement unterstützen können. Darüber hinaus erarbeiten die Projektpartner neue Lösungen für die Interoperabilität von OMERO mit elektronischen Laborbüchern und Empfehlungen für standardisierte Metadaten-Annotation in Schlagworten und Key-Value-Paaren in OMERO. Die unmittelbaren Vorteile für Nutzende der OMERO Software werden herausgestellt und es werden Trainingsmaterialien für den Umgang mit OMERO erarbeitet. Durch ein verbessertes Management der Bilddaten von Anfang an soll zudem die Ablage publizierter Daten in Bilddatenrepositorien wie dem BioImage Archive oder der Image Data Resource erleichtert werden.

Schulungsmaterialien

Selbstlerneinheit zum Forschungsdatenmanagement von Biodiversitätsdaten: Fischer, M., Röder, J., Signer, J., Tschink, D., Weibulat, T., & Brand, O. (2023, Dezember 14). NFDI4Biodiversity Self-Study Unit - Research Data Management for Biodiversity Data. Zenodo. https://doi.org/10.5281/zenodo.10377868

Trainingsmaterialien von GFBio zu Datenmanagementplänen, Semantik und Terminologien, Metadaten, Data Cleaning, Versionskontrolle, Dateibenennung, Open Source Plattformen für Biodiversitätsdatenmanagement: https://www.gfbio.org/materials/

WiNoDa Knowledge Lab: Verschiedene Selbstlern-Kurse für die Arbeit mit naturwissenschaftlichen Sammlungen und objektzentrierten Daten. Die Kurse vermitteln zentrale Themen wie den Umgang und die Wiederverwendung von Forschungsdaten, rechtliche und ethische Fragen bei der Feldforschung, die Verbesserung und Anreicherung von Daten, Texterkennung, Machine Learning und Open Science.

Einen Überblick über Schulungsmaterialien und Schulungsveranstaltungen der NFDI-Konsortien bieten folgende Quellen:


Zitiervorschlag (Chicago)

Redaktion von forschungsdaten.info. „Forschungsdatenmanagement in den Biowissenschaften“. forschungsdaten.info, 11. Dezember 2025. Link.