Informatik
In der Informatik können je nach Arbeitsgebiet höchst heterogene Forschungsdaten entstehen. Beim Programmieren entsteht Quellcode und andere Software-Artefakte, für maschinelles Lernen entstehen strukturierte Datenbanken, doch auch semi-strukturierte Daten wie die Knowledge Graphs der DBpedia und unstrukturierte Daten in wissenschaftlichen Publikationen sind zu finden.
Dies führt zu einer Fülle an unterschiedlichen Standards und Methoden, die in der Informatik zur Anwendung kommen. Hier bekommen Sie einen Überblick über unterschiedliche Projekte und Intiativen zum Forschungsdatenmanagement in der Informatik.
NFDI-Konsortien
Mit dem Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI) soll der digitale Wandel in den Wissenschaften nachhaltig gefördert werden. Das Ziel ist die Erschließung, Speicherung und langfristige Verfügbarkeit von Forschungsdaten unter den Herausforderungen, die FAIRes Forschungsdatenmanagement an die wissenschaftliche Forschung stellt.
NFDI4DataScience
NFDI für Datenwissenschaften und Künstliche Intelligenz
NFDIxCS
NFDI für und mit Computer Science
Projekte, Initiativen und Netzwerke
deRSE - Research Software Engineers
Wissenschaftliche Softwareentwicklung als ein elementarer, unverzichtbarer Bestandteil der Forschungstätigkeit.
RDA Software Source Code Interest Group
OpenML
OpenML is an open science platform for machine learning
Repositorien und Data Journals
Datenrepositorien bieten eine unkomplizierte Möglichkeit, Forschungsdaten zu veröffentlichen. Nur wenige Repositorien bieten ein Peer-Review an, dafür ist die Publikation dort in der Regel nur mit geringen oder gar keinen Kosten verbunden. Ein fachspezifisches Repositorium bietet eine bessere Auffindbarkeit der Daten als ein generisches. In der Informatik wird außer Daten auch sehr häufig Quellcode generiert, der in speziellen Code-Repostorien wie z. B. GitHub liegt.
Data Journals bieten analog zu klassischen wissenschaftlichen Zeitschriften, die Möglichkeit Forschungsdaten mit Peer-Review Prozess zu publizieren. Data Journals werden von Verlagen herausgebracht und sind in der Regel mit Kosten für den Leser oder den Autoren verbunden.
Repositorien
- Datenrepositorien für Informatik auf re3data.org
- UC Irvine Machine Learning Repository: Weltweit genutztes Repositorium für Datensätze des Maschinellen Lernens
Data Journals
Tools für die Informatik
Tools erleichtern Ihnen die Arbeit mit Ihren Daten. Hier stellen wir Tools vor, die speziell beim FDM in der Informatik weiterhelfen.
Lizenzen
Es gibt viele spezielle Lienzen für Software, manchmal ist es schwierig die richtige für die eigenen Zwecke zu finden. GitHub bietet unter choosealicense.com eine Entscheidungshilfe für Softwareentwickler.
Allgemeine Hilfsmittel
Weiterführende Informationen rund um Elektronische Laborbücher sind unter Beschreiben und Dokumentieren zusammengestellt. Die Informationen hier sind auf alle Wissenschaftsbereiche anwendbar.
Allgemeine Tools zu verschiedenen Bereichen des Forschungsdatenmanagements sind auf der Seite Tools zu finden.
Literatur
Buch „Forschungsdatenmanagement in der Informatik“
Autorinnen: Katarzyna Biernacka, Sandra Schulz
268 Seiten, Erscheinungsjahr: 2022
https://doi.org/10.30819/5490, ISBN 978-3-8325-5490-3
Obwohl das Informatikstudium sehr datenlastig ist, ist der korrekte Umgang mit diesen Daten nach der Guten Wissenschaftlichen Praxis vielen Studierenden unzureichend bekannt. Lehrende sind oftmals keine Expert:innen im FDM, sollen es aber adäquat betreiben und es dann sogar Studierenden vermitteln. Dieses Buch zeigt auf, welche thematischen Besonderheiten es für FDM in der Informatik gibt und wie diese in der Lehre adressiert werden können.
Das Buch inklusive aller Arbeitsmaterialien steht unter einer Creative Commons CC BY 4.0 International Lizenz für die Nachnutzung zur Verfügung.