FDM in der Chemie
In vielen Fällen fallen in der chemiebezogenen Forschung große Mengen an experimentellen Daten an, die in einer Vielzahl von Dateiformaten vorliegen. Darüber hinaus zeichnen sich die verschiedenen Teilbereiche der Chemie durch den Einsatz einer Vielzahl von Analysemethoden aus, die unter anderem experimentelle oder elektrochemische Messdaten, chromatographische Daten und Simulationsdaten liefern. Auch sind Kristall- und Molekülstrukturen für das Forschungsdatenmanagement (FDM) in der Chemie von Bedeutung.
Wichtige Anlaufstellen für chemiebezogenes FDM sind die folgenden Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI): NFDI4Chem ist das übergeordnete chemiebezogene Konsortium, NFDI4Cat widmet sich der katalytischen Chemie, NFDI-MatWerk deckt die Materialwissenschaften ab und FAIRmat befasst sich mit der chemischen Physik der Festkörper. Einige dieser Konsortien verfügen über Helpdesks, die Sie hier finden: NFDI4Chem, FAIRmat. Darüber hinaus gibt es einen Fachinformationsdienst für Pharmazie. Ein Fachinformationsdienst für Chemie befindet sich derzeit in der Konzeption.
Die heterogene Handhabung chemiebezogener Forschungsdaten erschwert die Etablierung einheitlicher FDM-bezogener Strukturen und Standards. Nachfolgend finden Sie eine Zusammenstellung von Angeboten, Tools und Diensten für das Forschungsdatenmanagement in der Chemie. Fehlt ein Angebot? Haben Sie das Gefühl, dass etwas nicht passt? Haben Sie Fragen? Wir freuen uns auf Ihre E-Mail.
Informieren und planen
Die Leitlinien der DFG zur Guten Wissenschaftlichen Praxis geben Informationen zum allgemeinen Umgang mit Forschungsdaten. Darüber hinaus hat die DFG einen Fragebogen zum Umgang mit Forschungsdaten veröffentlicht, der zur Bewertung von Anträgen verwendet wird.
Die Verwendung eines Datenmanagementplans (DMP) wird dringend empfohlen, um zu planen, wie Sie oder Ihre Forschungsgruppe mit Forschungsdaten umgehen. Darin wird festgelegt, welche Daten Sie sammeln und wie Sie dabei vorgehen werden. Außerdem wird darin dargelegt, wer Zugriff auf die Daten hat und was während und nach dem Forschungsprozess mit ihnen geschieht. Durch die frühzeitige Klärung dieser Fragen können viele Unsicherheiten bereits im Vorfeld ausgeräumt werden. Ein DMP ist kein feststehender Vertrag zwischen den beteiligten Parteien, sondern ein lebendiges Dokument, das während des Forschungsprozesses immer wieder angepasst werden sollte. Es gibt zahlreiche Leitfäden und Vorlagen zum Thema DMP. Der oben erwähnte Fragebogen der DFG zum Thema Chemie wurde in die chemiespezifische Vorlage umgesetzt, die Nutzer*innen durch die Erstellung eines Datenmanagementplans führt.
Die NFDI4Chem Knowledge Base bietet weitere Informationen und Empfehlungen zur Digitalisierung aller Schritte in der chemischen Forschung und unterstützt Forschende dabei, ihre Daten auf FAIR-konforme Weise zu veröffentlichen. Nutzerberichte zeigen, wie Open Science und Forschungsdatenmanagement gemäß den FAIR-Prinzipien umgesetzt werden können.
Tools
Daten sammeln und organisieren
In vielen akademischen Disziplinen sind elektronische Laborjournale (ELN) ein zentrales Element des Forschungsdatenmanagements. In der Chemie können ELNs verwendet werden, um (Teile der) Laborarbeit digital abzubilden: Dazu gehören die Planungsphasen eines Experiments, der automatische Import von Messergebnissen aus kompatiblen Geräten, die Aufzeichnung chemischer Reaktionen sowie die Vervollständigung der Daten, damit sie in Repositorien exportiert und veröffentlicht werden können. Darüber hinaus ist es im Forschungsdatenmanagement unerlässlich, Ihre Daten mit Metadaten zu versehen – ELNs unterstützen ihre Nutzenden dabei oder führen dies in einigen Fällen automatisch und selbstständig durch.
Der ELN Finder bietet einen Überblick über verfügbare ELNs und hilft Anwender*innen, Dienste zu finden, die für ihre spezifischen Anforderungen geeignet sind. Darüber hinaus liefert die NFDI4Chem Knowledge Base Kriterien für die Auswahl geeigneter ELNs.
Hier sind einige Open-Source-ELNs, die auf chemiebezogene Forschung spezialisiert sind (Links führen zu Testinstanzen):
- Chemotion ELN
- eLabFTW
- Herbie
- NOMAD ELN
- openBIS (Testinstanz auf Anfrage über helpdesk@nfdi4chem.de erhältlich)
- OpenEventory
- Scinote
Tools
Daten beschreiben und dokumentieren
Eine detaillierte Beschreibung der Speicherung Ihrer Daten ist erforderlich – idealerweise mit einer einheitlichen Struktur für Ihre Dateien und Ordner.
Bei der Arbeit mit vielen oder großen Datensätzen können die Vorteile von Datenbanken relevant werden. Wir empfehlen Ihnen zu prüfen, ob dies auf Ihr Projekt zutrifft. Weitere Informationen finden Sie in der Knowledge Base von NFDI4Chem.
Datenformate
Chemiebezogene Daten können in verschiedenen Formaten vorliegen. Ein Beispiel für menschenlesbare (Bezeichnung, Strukturdarstellung) und maschinenlesbare (SMILES, InChI, InChI-Key) Strukturinformationen ist unten für Koffein angegeben. Als zweite Dimension können wir zwischen proprietären und offenen Formaten unterscheiden. Oft erstellen Analysegeräte nur proprietäre Formate, die von Open-Source-Software nicht gelesen werden können. Konvertierungsdienste ermöglichen die Umwandlung von einem Dateiformat in ein anderes.
Tools
Online-Tool zum einfachen Konvertieren von Formaten
NOMAD unterstützt über 70 Parser für Dichtefunktionaltheorie (DFT) und Molekulardynamik-Codes. Diese Parser generieren hierarchische Beschreibungen von Molekülen und Monomeren, einschließlich detaillierter Schemata für quantenchemische Methoden, und extrahieren automatisch Metadaten aus Berechnungsdateien.
Metadaten
Es ist unerlässlich, Daten mit Metadaten zu beschreiben. Metadaten sind Daten über Daten oder Daten, die die Hauptdaten beschreiben. Eine NMR-Analyse umfasst beispielsweise die NMR-Dateien und Metadaten, die die Analysebedingungen wie Lösungsmittel, Instrument oder sogar den Namen von Chemiker*innen beschreiben. Während ein Mensch „John Smith“ vermutlich als Chemiker und nicht als Ausgangsmaterial erkennen würde, ist dies einer Maschine nicht möglich. Um FAIR zu sein, benötigt also jedes einzelne Datum seine eigenen Metadaten. Damit diese Metadaten von Menschen und Maschinen gleichermaßen gut verstanden werden, müssen sie standardisiert werden. Aus diesem Grund ist die Metadatenunterstützung durch ELNs und Repositorien so hilfreich. MIChIs (Minimum Information for Chemical Investigations) und ihre Formalisierung als Metadatenschemata wurden entwickelt, um Standardisierung und Reproduzierbarkeit zu gewährleisten. Mit solchen (minimalen) Metadatensätzen können wir sicherstellen, dass die Analyse-Methode für andere Forschende, die die Untersuchung replizieren möchten, verständlich ist.
MIChIs:
- MARGARITAS (MIChI-Standard für die Berichterstattung über NMR-Experimente mit kleinen Molekülen im flüssigen Zustand; veröffentlicht)
- UV-Vis (MIChI für Ultraviolett-Visible-Absorptionsspektrophotometrie; in Vorbereitung)
Terminology Service
Der Terminology Service ist ein Repositorium für Ontologien im Bereich der Chemie. Er ist eine zentrale Anlaufstelle für die neuesten Versionen von Ontologien und bietet Informationen zu deren Umfang, Anwendungsbereichen und Kurator*innen.
Letztendlich könnte jeder Forschende seine eigenen Metadaten erfinden, was zu gegenseitiger Unverständlichkeit führen würde. Um dies zu vermeiden, empfehlen wir die Verwendung von Terminologien, da diese strukturierte Vokabulare verwenden. In diesem Sinne schaffen Ontologien semantische Verbindungen zwischen den Begriffen. Dies macht Daten wirklich interoperabel und maschinenlesbar. Ontologien sind zwar schwer zu verstehen, aber für FAIRe Daten von entscheidender Bedeutung.
Daten veröffentlichen und archivieren
Ähnlich wie traditionelle wissenschaftliche Zeitschriften können auch Datenjournale zur Veröffentlichung von Forschungsdaten genutzt werden. In der Regel finden Peer-Reviews statt. Die meisten Datenzeitschriften werden von Verlagen herausgegeben und sind für ihre Leser*innen oder Autor*innen mit Veröffentlichungsgebühren verbunden. Nachfolgend finden Sie eine Auswahl bekannter Datenzeitschriften, die zur Veröffentlichung chemiebezogener Datensätze genutzt werden können:
- Chemical Data Collections (CDC): Von Elsevier herausgegebene Datenzeitschrift, die chemiebezogene Forschungsdaten aus allen Teilbereichen abdeckt. Einige der Datenartikel sind im Open Access verfügbar.
- Journal of Chemical and Engineering Data (JCED): Monatlich erscheinende Zeitschrift für ergänzende Daten aus Experimenten und Berechnungen. Angeboten von der American Chemical Society (ACS), kostenpflichtig.
- Journal of Physical and Chemical Reference Data (JPCRD): Vierteljährlich erscheinende Datenzeitschrift für Eigenschaftsdaten aus Physik und Chemie. Teilweise im Open Access verfügbar.
Datenrepositorien sind die gängigste Methode zur Veröffentlichung von Forschungsdaten. Sie sind in der Regel mit geringen oder gar keinen Veröffentlichungsgebühren verbunden. Wir empfehlen, nach Möglichkeit fachspezifische Repositorien zu wählen, da diese die Auffindbarkeit Ihrer Daten im Vergleich zu generischen Repositorien verbessern. NFDI4Chem hat Empfehlungen zur Suche nach Repositorien und eine Auswahl relevanter fachspezifischer Repositorien zusammengestellt. Alternativ können Sie re3data nach chemiebezogenen Repositorien durchsuchen.
Darüber hinaus verbessert die Verwendung von Datenverfügbarkeitserklärungen die Auffindbarkeit der Daten, indem Manuskripte mit entsprechenden FAIRen Datensätzen in Forschungsdaten-Repositorien verknüpft werden. Dabei ist es wichtig, dass PIDs wie DOIs verwendet werden. Es kann auch repositoriumspezifische Identifikatoren oder Zugangsnummern geben.
Daten finden und nachnutzen
Der NFDI4Chem Search Service bietet eine umfassende Suche in den verschiedenen Chemie- und chemiebezogenen Repositorien der NFDI4Chem.
NOMAD bietet Forschenden leistungsstarke Such- und Erkundungstools, mit denen sie auf Millionen von Dateneinträgen in den Bereichen Physik, Materialwissenschaften und Chemie zugreifen können. Benutzer können nach chemischer Formel, Struktur, Methode oder Eigenschaft suchen und auf die strukturierten Daten oder Rohdateien zugreifen. Die interaktiven Schnittstellen unterstützen die Visualisierung, Filterung und den Vergleich von Ergebnissen, was die Identifizierung und Wiederverwendung relevanter Daten in neuen Studien erleichtert.
Zusätzlich zum generischen Erkundungsmenü bietet NOMAD spezielle Suchschnittstellen und Datenansichten über mehrere domänenspezifische Datenbanken, wie z. B. heterogene Katalyse, metallorganische Gerüste und Halogenid-Perowskit-Ionen. Diese Datenbanken unterstützen die Suche, den Vergleich und die Wiederverwendung verwandter Daten aus verschiedenen Studien und bieten Referenzdatensätze, die als Grundlage für neue Forschungsarbeiten dienen können.
Schulungsmaterialien
Schulungen
NFDI4Chem bietet kostenlose 1–2-tägige FDM- und Chemotion-Workshops an (Anfragen über den Helpdesk).
Videos
Weiterführende Literatur
Artikel: „Umgang mit Forschungsdaten in der Chemie“
Autor*innen: Fachkollegien Chemie
Erscheinungsjahr: 2023
Link zur DFG-Website
Zitiervorschlag (Chicago)
Redaktion von forschungsdaten.info. „Forschungsdatenmanagement in der Chemie“. forschungsdaten.info, 18. November 2025. Link.