Skip to main navigation Skip to main content Skip to page footer

Daten dokumentieren

Warum, was und wie?

„Der Zeitaufwand, den ich 2019 habe, um Daten aus dem Jahr 2011 auszugraben, ist sehr viel geringer, wenn ich die Daten 2011 gut dokumentiert habe.“

- PhD Maike Paul, Küstenforschung

Von sinnvoll und detailliert dokumentierten Forschungsdaten profitieren Datenerzeugende, ihre Projektgruppe und eventuelle Nachnutzende. Die Dokumentation erleichtert das (Wieder-)Finden von Daten und aktuellen Versionen, eine konsistente Datenhaltung innerhalb eines Projektes, ihre Publikation und die Relevanzbewertung durch Nachvollziehbarkeit ihrer Entstehung. Außerdem ermöglicht sie die Interpretation und das Zusammenführen mit anderen Daten dank Kontextinformationen.[1]

Eine gute Dokumentation erhöht die Nachvollziehbarkeit, ermächtigt potenzielle Nachnutzende und verringert aufwändige Nachfragen bei den Datenerzeugenden. Eigentlich notwendige Nachfragen werden in vielen Fällen nicht gestellt, wenn die Daten nicht verständlich oder Ergebnisse nicht nachvollziehbar sind wodurch das Potential der Daten nicht ausgeschöpft wird.[2] Je besser ein Datensatz dokumentiert ist, desto wahrscheinlicher ist es, dass dieser von Dritten genutzt und zitiert wird und die Datenerzeugerin oder der Datenerzeuger dadurch „Credit“ in Form einer wissenschaftlichen Zitation erhält.

Darum gehört eine angemessene Dokumentation zur Guten Wissenschaftlichen Praxis und ist ein wichtiger Schritt zur Produktion FAIRer Daten.

Hauptbestandteil von Datendokumentation und -beschreibung sind Metadaten („Daten über Daten“). Metadaten in maschinenlesbarer Form unterstützen primär die Auffindbarkeit, eindeutige Identifikation und maschinelle Verarbeitung von Forschungsdaten, während menschenlesbare Metadaten die Relevanzbewertung und Nachnutzbarkeit verbessern. Es sollten möglichst viele Informationen in beiden Formen vorliegen.

Was dokumentieren?

Für die spätere Auswertung und Nachnutzung der Daten ist es wichtig, diese möglichst detailliert zu beschreiben. Folgende Aspekte sollten bei der Dokumentation der Daten berücksichtigt werden:

  1. Ursprüngliches Forschungsvorhaben (Projekttitel/Person),
  2. Kontext der Erhebung (Projektziele, Hypothesen),
  3. Erhebungsmethode (Sampling-Methode, Instrumente, verwendete Hard- und Software, sekundäre Datenquellen, Erhebungsort und Erhebungszeitraum),
  4. Struktur der Daten und deren Beziehungen zueinander (wie sind die Daten aufgebaut, was enthalten sie; bei mehreren Datensätzen: wie gehören sie zusammen, welche Daten braucht man, um die anderen Daten richtig zu interpretieren),
  5. Qualitätsmaßnahmen (Bereinigung, Gewichtung, Datenprüfung etc.),
  6. Erklärungen für Codes und Labels (Codebook),
  7. Datenversionen und die enthaltenen Änderungen,
  8. Informationen zum Zugang, Nutzungsbedingungen und Vertraulichkeit.

Ein gleichberechtigter Ansatz der Dokumentation ist die Beantwortung der folgenden Fragen:

  1. Wer hat die Daten generiert/gesammelt?
  2. Wie wurden die Daten gesammelt, vorbereitet und verarbeitet?
  3. Was beinhaltet das Datenpaket?
  4. Warum wurden die Daten gesammelt?
  5. Wann wurden die Daten gesammelt?
  6. Wo wurden die Daten gesammelt?

Auch bei der besten Dokumentation kann es immer wieder zu Nachfragen kommen. Daher ist es wichtig und sinnvoll, eine dauerhafte Kontaktmöglichkeit zur Datenautorin oder zum Datenautor anzugeben, z. B. eine gepflegte ORCID.

Die DFG hat eine Checkliste zum Umgang mit Forschungsdaten veröffentlicht, in der auch auf die Datendokumentation eingegangen wird.

Wie dokumentieren?

Generell gilt, dass für jedes Forschungsprojekt individuell entschieden werden muss, welche Art der Dokumentation am geeignetsten ist. Auch die Ausführlichkeit kann je nach Anforderung von einer Minimalbeschreibung zu einem Data Curation profile reichen.

Wichtig bei der Dokumentation von Daten:

  • Einheitliche, möglichst etablierte und standardisiertes Vokabulare und Terminologien (z. B. des Fachbereiches) verwenden
  • Maschinenlesbarkeit (z. B. durch strukturierte und als XML oder JSON abgespeicherte Metadaten dank Nutzung von Metadatenschemata) – dies übernehmen Repositorien im Falle einer Publikation
  • Nutzung von Persistenten Identifikatoren zur eindeutigen Zuordnung von Angaben (z. B. zu Personen, Institutionen, Orten)

Formate und unterstützende Tools

Inzwischen gibt es einige Tools, die die Datendokumentation durch strukturierte Eingabemöglichkeiten oder eigenständige Erfassung und Verlinkung von Metadaten unterstützen. Ausführliche Informationen und Links werden im Artikel Metadaten im Forschungsalltag aufgeführt.

Readme-Datei

Besonders einfach umzusetzende Dokumentation in separater Textdatei, die alle wichtigen Kontextinfomationen enthält. Das Ziel ist es, anderen Forschenden einen Überblick über die Daten und zum Verständnis wichtige Kontexte zu geben. Etliche Repositorien bieten eigene Template-Vorlagen an.

Readme-Dateien können im Rahmen der Datenpublikation begleitend veröffentlicht werden.

Datenmanagementplan (DMP)

Wird vermehrt von Förderinstitutionen bei der Antragstellung gefordert, kann aber auch als projektbegleitendes Dokument die Datendokumentation bereichern. Kann als Textdatei oder innerhalb eines Tools gepflegt werden, wobei letztere Anforderungen unterschiedlicher Förderinstitutionen adressieren. 

(Elektronisches) Laborbuch

Begleiten in vielen Fällen den Forschungsprozess und enthalten natürlicherweise Informationen über die Experimente (Zeitpunkt, Instrumente) und Daten. Einige ELN-Tools bieten automatische Auslieferung von Metadaten an. Weitere Informationen finden Sie in unserem Artikel zu Elektronischen Laborbüchern.

Virtuelle Forschungsumgebungen (VFU)

Disziplinspezifische Lösungen für ortsunabhängige Zusammenarbeit im gesamten Forschungsprozess (Erhebung, Analyse, Auswertung, Visualisierung, Teilen). Sie speichern teilweise automatisch (spezifische) Metadaten, welche maschinell extrahiert werden können.

Projektinternes Wiki

In größeren Projekten mit vielen Beteiligten kann ein Wiki für die Datendokumentation verwendet werden. Der Vorteil von Wikis ist, dass die Dokumentation in Zusammenarbeit entstehen kann, allerdings sind hierfür Vorgaben und Absprachen dringen nötig.

Ordnerstruktur und Dateibenennung

Die Ordnerstruktur sollte einheitlich, hierarchisch und kategorisiert sein. Zu viele Ordner auf einer Ebene schaden der Übersichtlichkeit. Konsistente Benennung von Ordnern und Dateien tragen ebenfalls zur Datendokumentation bei und erleichtern das Durchsuchen und Finden von Daten (beschreibender Titel, Änderungsdatum, Version). Vermieden werden sollten spezielle Sonderzeichen und zu lange Benennungen.

Datei selber bzw. in den Metainformationen der Datei

Dateien enthalten selbst Metainformationen in ihren Eigenschaften, z. B. Dateigröße-, -format,- Auflösung, Entstehungsdatum und Instrument.

Wenn möglich, sollten maschinell produzierte Metadaten, die vielleicht direkt bei der Erstellung der Daten entstehen, immer ausgelesen und gespeichert werden. Dies kann schon einen großen Teil der Arbeit abnehmen.

Prüfen Sie Ihre Dokumentation auf Vollständigkeit, Eindeutigkeit, Korrektheit, Aktualität, Genauigkeit, Konsistenz, Relevanz, Einheitlichkeit, Zuverlässigkeit und Verständlichkeit. Um die Qualität der Dokumentation zu testen, kann man sie einer Person außerhalb des Forschungsprojektes geben.

Weiterführende Literatur

Schulungsmaterialien: „Faires Datenmanagement
Autor*innen: Manuela Richter, Gery Weyd, Maximilian Weyland, Jörg Panzer, Johannes Putzke
Erscheinungsjahr: 2025
Link zu den Schulungsmaterialien

Schulungsmaterialien: „FAIRes Dateimanagement: Reflexionsdatei & Vorlage ReadMe
Autor*innen: Manuela Richter, Jörg Panzer, Johannes Putzke
Erscheinungsjahr: 2025
Link zu den Schulungsmaterialien

Einführungsmaterialien: “Research Data Management Intro Series: Coffee Lectures & Espresso Shots
Autorin: Jeanne Wilbrandt
Erscheinungsjahr: 2024
Link zur Veröffentlichung

Guide: “Create metadata for your research project
Autor*innen: Stanford University Libraries
Erscheinungsjahr: 2024
Link zum Guide

Handreichung: “Recommendation on research data documentation from the Open Science, Research Data Management Support
Autor*innen: Bern University Library
Erscheinungsjahr: 2023
Link zur Handreichung

Webseite: “The Importance of Documentation in Research: Keeping Accurate and Detailed Records
Autor: Quincy
Link zur Webseite

Quellen

[1] Gregory, K., Groth, P., Scharnhorst, A., & Wyatt, S. (2020). Lost or Found? Discovering Data Needed for Research. Harvard Data Science Review. https://doi.org/10.1162/99608f92.e38165eb

[2] Baker, M. (2016). 1,500 scientists lift the lid on reproducibility. Nature, 533(7604), 452–454. https://doi.org/10.1038/533452a


Zitiervorschlag (Chicago)

Redaktion von forschungsdaten.info. „Daten dokumentieren“. forschungsdaten.info, 17. Dezember 2025. Link.