Skip to main navigation Skip to main content Skip to page footer

FAIRe Daten

Good data management is not a goal in itself, but rather is the key conduit leading to knowledge discovery and innovation, and to subsequent data and knowledge integration and reuse by the community after the data publication process.“

- Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. (2016). https://doi.org/10.1038/sdata.2016.18

 

Die FAIR-Prinzipien wurden von der FORCE11-Community geprägt und 2016 das erste Mal beschrieben.[1] In den letzten Jahren sind sie ein essenzieller Standard im Forschungsdatenmanagement geworden.

FAIR steht für Findable (auffindbar), Accessible (zugänglich), Interoperable (kompatibel) und Reusable (nachnutzbar). Die Prinzipien sollen Orientierung für den Umgang mit Forschungsdaten bei der Dokumentation, Veröffentlichung und Archivierung bieten. Ziel ist es, Forschungsdaten für Menschen und Maschinen optimal aufzubereiten und zugänglich zu machen, sodass die Wiederverwendbarkeit von Datenbeständen verbessert wird.

Das Akronym FAIR ist inzwischen fester Bestandteil des Fachjargons von Forschungsdatenmanager*innen und wird auch als Adjektiv, wie in „FAIRe Daten“ oder in Wortschöpfungen wie „FAIRification“ verwendet. Auch in Policys und Vorgaben unterschiedlichster Player wird der Begriff immer häufiger verwendet, z. B. seit 2017 in den Förderrichtlinien der EU.

Die FAIR-Prinzipen nach GO FAIR

Findable (auffindbar)

F1. (Meta-) Daten erhalten eine global eindeutige und dauerhafte Kennung.

F2. Daten werden mit umfangreichen Metadaten beschrieben (siehe R1).

F3. Metadaten enthalten eindeutig und explizit die Kennung der von ihnen beschriebenen Daten.

F4. (Meta-) Daten werden in einer durchsuchbaren Ressource registriert oder indiziert.

Accessible (zugänglich)

A1. (Meta-) Daten können anhand ihrer Kennung unter Verwendung eines standardisierten Kommunikationsprotokolls abgerufen werden.

  • A1.1 Das Protokoll ist offen, kostenlos und universell implementierbar.
  • A1.2 Das Protokoll ermöglicht bei Bedarf ein Authentifizierungs- und Autorisierungsverfahren.

A2. Auf Metadaten kann zugegriffen werden, auch wenn die Daten nicht (mehr) verfügbar sind.

Interoperable (interoperabel)

I1. (Meta-) Daten verwenden eine formale, zugängliche, gemeinsame und allgemein anwendbare Sprache für die Wissensrepräsentation.

I2. (Meta-) Daten verwenden Vokabulare, die den FAIR-Prinzipien folgen.

I3. (Metadaten) enthalten qualifizierte Verweise auf andere (Meta-) Daten.

Reusable (wiederverwendbar)

R1. (Meta-) Daten werden mit einer Vielzahl genauer und relevanter Attribute ausführlich beschrieben.

  • R1.1. (Meta-) Daten werden mit einer eindeutigen und zugänglichen Datennutzungslizenz veröffentlicht.
  • R1.2. (Meta-) Daten sind mit detaillierten Informationen über die Entstehung versehen.
  • R1.3. (Meta-) Daten entsprechen domänenrelevanten Community-Standards.

Wozu FAIR?

  • Bessere Auffindbarkeit von Datensätzen durch veröffentliche Metadaten und Verlinkungen zu verwandten Publikationen
  • Einfachere Nachvollziehbarkeit der Daten durch ausführliche Beschreibungen
  • Transparente Nachnutzungsbedingungen durch Angabe von Lizenzen und so größere Sichtbarkeit
  • Vereinfachte Zusammenarbeit durch interoperable Dateiformate
  • Öffnen der Daten für neue Nutzungsszenarien, da Daten mittels der FAIR-Prinzipien auch außerhalb der eigenen wissenschaftlichen Community aufgefunden, verstanden und ausgelesen werden können.

FAIR in der eigenen wissenschaftlichen Arbeit umsetzen

Wie in der obigen Darstellung ersichtlich, ähneln oder doppeln sich die FAIR-Prinzipen teilweise in ihren Anforderungen. Ihre Umsetzung gelingt am leichtesten, wenn Daten in einem offenen Datenarchiv abgelegt oder ein (zertifiziertes) Repositorium hochgeladen werden. Dies ermöglicht mindestens eine Datenbeschreibung nach Minimalstandards und den einfachen und geregelten Zugriff auf Daten durch Dritte.

FAIRe Daten müssen nicht für alle zugänglich sein, aber es sollte möglich sein, sie unabhängig von den Erhebenden aufzufinden und zu verstehen. So ist die nicht-öffentliche, dokumentierte Ablage von Daten in einem Datenarchiv oder bei einem Forschungsdatenzentrum ebenfalls FAIR, da besagte Daten z. B. von institutionellen Infrastruktureinrichtungen aufgefunden bestimmt werden kann, welche Zugangsrechte zu Daten bestehen. Relevant ist primär, dass an einem Datensatz Interessierte auf Basis der veröffentlichten Metadaten ermitteln können, ob die Daten für sie relevant sind und wie sie ggf. zugänglich sind.

Auffindbarkeit

  • Ablegen der Daten in einer durchsuchbaren Online-Oberfläche, z. B. einem Repositorium
  • Nutzung von Persistenten Identifikatoren (PID) zum eindeutigen und dauerhaften Referenzieren zusätzlich zu einer URL
    • Beidseitiges Verknüpfen/Referenzieren mit zugehörigen Publikationen (z. B. Artikeln), z. B. mit DOIs
  • Beschreiben des Forschungskontexts und des Datenpaketes durch möglichst ausführliche und standardisierter Metadaten. Siehe auch: Beschreiben und Dokumentieren.

Zugänglichkeit

  • Metadaten sollten durch das Repositorium ohne lizenzrechtliche Einschränkungen online abrufbar sein
  • Gegebenenfalls Anwendung von Zugangsbeschränkungen im Repositorium/Datenarchiv, sofern keine freie Veröffentlichung gewünscht/möglich ist

Interoperabilität

Wiederverwendbarkeit

  • Ausführliche Beschreibung mit Metadaten, in Readme-Dateien oder Data Description Templates.
  • Eindeutige Nennung der Nachnutzungskriterien / Lizenzierung
  • Vergabe eines PID für dauerhafte Referenzierbarkeit

Den technischen Anteil der Anforderungen können und sollten Betreibende von Repositorien oder Datenarchiven umsetzen, zum Beispiel Aspekte der Zugänglichkeit und Vergabe von DOIs. Einen Hinweis darauf, dass ein Repositorium diese Anforderungen erfüllt, geben Zertifikate wie CoreTrustSeal.

Die FAIRness der eigenen Datenpakete kann durch Tools überprüft und verbessert werden:

Tipps für Repositorienbetreibende

Einige Faktoren für FAIRe Datenpublikationen liegen nicht in der Hand der Publizierenden, sondern sollten durch Betreiber*innen von Repositorien oder Datenarchiven umgesetzt werden.

Bei der Planung oder Pflege eines Repositoriums sollte darauf geachtet werden, dass die FAIR-Prinzipien bedient werden. Die Umsetzung variiert nach Repositoriensoftware ist unterschiedlich und sollte vor der Entscheidung für eine Software evaluiert werden.

Vergabe eines PID

Ermöglichen Sie die automatische Vergabe von PIDs für die hochgeladenen Inhalte. Etabliert für Forschungsdaten ist der DOI, aber auch andere PIDs können hier infrage kommen (vgl. auch die Seite für Forschungsdaten des PID Network) . Für die Anmeldung von DOI ist eine Mitgliedschaft bei DataCite (z.B. über das TIB DOI Konsortium oder den DOI Service Austria) oder crossref nötig. Weitere DOI-Registrys finden Sie auf der DOI-Webseite
Alternativ, aber bei Forschenden weniger bekannt: URN

Verpflichtende und anpassbare Angaben von Metadaten

Machen Sie beim Ingest die Angabe eines Mindest-Metadatensatzes verpflichtend, z. B. von DataCite oder DublinCore.
Bieten Sie zur Verbesserung der Datenbeschreibung weitere Metadatenfelder an, z. B. Felder für fachspezifische Metadaten. Nutzen Sie dafür definierte Schemas.

Integration von Thesauri

Ermöglichen Sie die Schlagwortvergabe nicht nur im Freitext, sondern auch mithilfe generischer (z. B. GND) oder fachspezifischer Vokabularien.

Verlinkung mit anderen PID

Ermöglichen Sie die Angabe von oder Verlinkung mit PIDs, vor allem persönliche oder institutionelle PID wie ORCID und ROR. PIDs für Instrumente, Veranstaltungen oder ähnliches sind ebenfalls nützlich und relevant. Einen Überblick über mögliche PIDs und Services bietet PID4NFDI.

Durchsuchbarkeit und Harvesting

Stellen Sie sicher, dass Ihre Metadaten über Schnittstellen geharvested werden können, bieten Sie offene Schnittstellen an (JSON, OAI-PMH)

Rechtemanagement und Lizenzen

Wenn Sie kein reines Open-Access-Repositorium anstreben, berücksichtigen Sie das Rechtemanagement. Wer darf auf welche Weise auf nicht-öffentliche Daten zugreifen? Wer übernimmt die Verifizierung der Zugriffsanfragen?

Bieten Sie verschiedene Lizenzen an, vor allem wenn neben Forschungsdaten auch Forschungssoftware abgelegt werden kann

Versionierung ermöglichen

Ermöglichen Sie die Versionierung von Datensätzen und die gegenseitige Verlinkung dieser Versionen

  • Dauerhafte Verfügbarkeit der Metadaten sicherstellen
  • Beratung/Datenkuratierung/Informationsmaterialien anbieten

Unterstützen Sie Ihre Forschenden, indem Sie auf Ihrer Webseite Informationen, Vorlagen und weitere Materialien anbieten. Verweisen Sie auf (fachspezifische) Helpdesks. Die Kuratierung von Metadaten durch Data Stewards oder Repositorienbetreibende verbessert in den meisten Fällen deren FAIRness.

Quellen

[1] Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., Da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016.18

nach oben


Zitiervorschlag (Chicago)

Redaktion von forschungsdaten.info. „FAIRe Daten“. forschungsdaten.info, 26. Januar 2026. Link.