Daten publizieren
Wissenschaftliches Arbeiten basiert meist und produziert auch Forschungsdaten. Allerdings sind Forschungsdaten längst nicht nur für die eigene Tätigkeit einzelner Forschender bzw. Arbeitsgruppen relevant. So fordern viele Forschungsförderer und auch Forschungseinrichtungen in ihren Policys das Publizieren von Forschungsdaten - sofern keine wichtigen Gründe dagegen sprechen. Denn das offene Zugänglichmachen von Daten ermöglicht eine Nachnutzung der Daten durch andere Forschende.
Welche Vorteile bringt das Veröffentlichen von Forschungsdaten?
1. Mehr Sichtbarkeit für Forschungsergebnisse
Durch die offene Bereitstellung und Zitierung von Forschungsdaten steigt die Reichweite und Nachvollziehbarkeit wissenschaftlicher Arbeiten.
2. Neue und ergänzenden Hypothesen entstehen
Forschende können vorhandene Datensätze analysieren und daraus neue Forschungsfragen oder alternative Interpretationen ableiten.
3. Neue Kooperationen entstehen
Der freie Zugang zu Daten erleichtert den Austausch zwischen (internationalen) Forschungsteams und fördert gemeinsame Projekte.
4. Wissenschaftliche Integrität wird gestärkt und das Vertrauen in die Forschung erhöht
Transparente Datennutzung ermöglicht Überprüfbarkeit und Nachvollziehbarkeit, was die Glaubwürdigkeit wissenschaftlicher Ergebnisse erhöht.
5. Förderung einer offenen Wissenschaftskultur
Offene Datenpraktiken unterstützen den Wandel hin zu mehr Transparenz, Teilhabe und Gemeinschaftssinn in der Wissenschaft.
6. Nicht reproduzierbare, einmalige Daten gehen nicht verloren
Durch die Archivierung solcher Daten können sie auch in Zukunft für neue Fragestellungen genutzt werden.
7. Kostenersparnis
Bereits vorhandene Datensätze können wiederverwendet werden, wodurch Forschungsressourcen effizienter eingesetzt werden.
Welche Daten eignen sich für eine Veröffentlichung?
Entscheidungshilfe
Auch wenn die Publikation von Forschungsdaten viele Vorteile bringt, gibt es doch auch Gründe, die gegen das Veröffentlichen eines Datensatzes sprechen. Dieses Diagramm kann dabei helfen zu entscheiden, welche Daten publiziert werden sollten:
Datenqualität
Ein qualitativ hochwertiger Datensatz, der gut dokumentiert, ethisch einwandfrei und leicht zu teilen ist, leistet nicht nur einen wichtigen Beitrag zur Forschungsgemeinschaft, sondern erhöht auch die Anerkennung und den Einfluss der eigenen Forschungsarbeit.
Bei der Erhebung und Verarbeitung von Forschungsdaten wurde im besten Fall auf eine möglichst gute Datenqualität geachtet, sodass es bei der Publikation vor allem darum geht, einen Veröffentlichungsort zu finden, welcher die Anforderungen an Datenqualität unterstützt.
Insbesondere Repositorienbetreibende sollten sicherstellen, dass die Metadaten ihrer Repositorien in Suchsystemen wie Bibliothekskatalogen oder Internet-Suchmaschinen indexiert sind, kontrollierte Vokabulare, Normdaten und ggf. Ontologien zur Beschreibung genutzt werden und in einem formalen, zugänglichen und allgemein anwendbaren Format (bspw. Verwendung von Standard-Dateiformaten, z. B. JSON-LD, RDF) vorliegen. All dies ist essenziell für die Auffindbarkeit von Forschungsdaten über Mehrwertdienste. Diese Schritte tragen überdies dazu bei, dass die mit den Daten verbundenen Metadaten maschinenlesbar sind und steigern so auch die Nachnutzbarkeit eines Datensatzes. Nicht zuletzt sollte der Datensatz auch mit persistenten Identifikatoren (beispielsweise DOI) versehen sein.
Folgende Schritte im Rahmen der Publikation verbessern zudem die Qualität eines Datensatzes:
- Daten logisch in Sammlungen organisieren und die Zusammenhänge beschreiben
- umfassende Beschreibung der Daten mit möglichst standardisierten Metadaten
- Einhaltung von fachspezifischen Standards und Konventionen wie der Wahl geeigneter Dateiformate
- Lizenzierung unter Berücksichtigung ethischer und rechtlicher Aspekte
- Bereitstellung klarer Verwendungs- und Zitationsvorschläge
Wo kann man Forschungsdaten publizieren?
Repositorien
Repositorien sind Speicherorte für digitale Objekte und stellen diese öffentlich oder auch für beschränkte Nutzerkreise zur Verfügung. Repositorien lassen sich unterscheiden:
- nach der Art der zu speichernden Objekte (Textpublikationen oder Forschungsdaten),
- nach der Domäne der enthaltenen Daten (institutionell, fachlich oder generisch),
- nach der Speicherfrist der Daten (z. B. 10 Jahre, um den Regeln der Guten Wissenschaftlichen Praxis zu entsprechen, oder dauerhaft) oder
- nach den Policys, mit denen die Daten abgerufen und nachgenutzt werden dürfen.
Beispiele für Forschungsdatenrepositorien können der institutionelle Publikationsserver einer Universität, ein fachliches Datenrepositorium, ein Forschungsdatenzentrum oder ein Langzeitarchiv für Daten und Publikationen sein.
In manchen Fällen prüfen Kurator*innen Daten vor deren Aufnahme in ein Repositorium (dem Ingest) hinsichtlich ihrer inhaltlichen oder technischen Qualität, teilweise auch mit Blick auf rechtliche Aspekte (Urheberrecht, Datenschutz). So stellen sie sicher, dass die Daten in der vorliegenden Form durch Dritte nutzbar sind.
Ein Repositorium auswählen
Bei der Wahl des Repositoriums ist es zur Auffindbarkeit der Daten sinnvoll, ein von der Fachcommunity empfohlenes, fachlich einschlägiges Repositorium auszuwählen. Diese verwenden üblicherweise einschlägige Metadatenstandards und erhöhen so die Auffindbarkeit der enthaltenen Datensätze im Vergleich zu generischen oder institutionellen Repositorien. Ein Hinweis darauf, dass Repositorien die Anforderungen an Datenqualität berücksichtigen, sind Zertifikate wie beispielsweise das CoreTrustSeal oder das nestor-Siegel. Repositorien mit einem solchen Zertifikat gewährleisten die Integrität und Authentizität der Daten, deren langfristige Aufbewahrung und Zugang, die Einhaltung disziplinärer und ethischer Normen sowie die Qualität der technischen Daten und Metadaten. Allerdings bewirbt sich nicht jedes Repositorium um eine Zertifizierung, sodass die Abwesenheit eines Siegels nicht gleichbedeutend mit einer Unzuverlässigkeit eines Repositoriums ist. Vielmehr zeigt der Vorhandensein eines Siegels die Bemühungen um größtmögliche Zuverlässigkeit eines Repositoriums an.
Die Auswahl eines passenden Repositoriums sollte sich nach den Gepflogenheiten der jeweiligen Fachdisziplin oder den Vorgaben von Förderinstitutionen bzw. Verlagen richten. Sie hängt auch davon ab, ob Daten für einen bestimmten Zeitraum (z. B. für zehn Jahre) bewahrt oder langzeitarchiviert werden sollen.
Einen Überblick über Repositorien sowie eine Suchfunktion mit einer großen Auswahl an Filtereinstellungen bietet re3data. Diese Datenbank hält auch Informationen bereit zu Identifiervergabe, Open Access oder Zertifizierung der Repositorien. Ein Verzeichnis deutscher Repositorien bietet RIsources, ein Portal für Forschungsinfrastrukturen der DFG. Eine Liste österreichischer Repositorien finden Sie auf unserer Webseite. Weitere Informationen zu fachspezifischen Repositorien finden Sie unter FDM nach Disziplinen.
Wenn kein passendes fachspezifisches oder institutionelles Repositorium gefunden werden kann, können auch generische Repositorien in Betracht gezogen werden. Einen Vergleich verschiedener generischer Repositorien bietet das Generalist Repository Comparison Chart.
Datenjournale
Neben den klassischen wissenschaftlichen Fachzeitschriften für Textpublikationen, gibt es Datenjournale (data journals), in denen Artikel publiziert werden, die Daten nur beschreiben, sie jedoch nicht interpretieren. Solche Artikel beschreiben z. B. Datensätze, die besonders bedeutend oder umfassend sind oder eine große Komplexität aufweisen. Der besondere Vorteil dieser Datenbeschreibungen ist, dass sie entsprechend den Forschungsartikeln in klassischen Fachjournalen ein Peer-Review-Verfahren durchlaufen und damit einem hohen Qualitätsstandard entsprechen.
Datenjournale können z. B. über diese Liste auf forschungsdaten.org gefunden werden. Auch eine nach Fächern sortierte Liste der Universität Würzburg liefert Hinweise zu einigen Datenjournalen. Eine kommunal gepflegte Liste von Datenjournalen wird über GitHub kontinuierlich aktualisiert.
Zitiervorschlag (Chicago)
Redaktion von forschungsdaten.info. „Daten publizieren“. forschungsdaten.info, 26. Januar 2026. Link.