Skip to main navigation Skip to main content Skip to page footer

FDM in der Chemie

In vielen Fällen fallen in der chemiebezogenen Forschung große Mengen an experimentellen Daten an, die in einer Vielzahl von Dateiformaten vorliegen. Darüber hinaus zeichnen sich die verschiedenen Teilbereiche der Chemie durch den Einsatz einer Vielzahl von Analysemethoden aus, die unter anderem experimentelle oder elektrochemische Messdaten, chromatographische Daten und Simulationsdaten liefern. Auch sind Kristall- und Molekülstrukturen für das Forschungsdatenmanagement (FDM) in der Chemie von Bedeutung.

Wichtige Anlaufstellen für chemiebezogenes FDM sind die folgenden Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI): NFDI4Chem ist das übergeordnete chemiebezogene Konsortium, NFDI4Cat widmet sich der katalytischen Chemie, NFDI-MatWerk deckt die Materialwissenschaften ab und FAIRmat befasst sich mit der chemischen Physik der Festkörper. Einige dieser Konsortien verfügen über Helpdesks, die Sie hier finden: NFDI4Chem, FAIRmat. Darüber hinaus gibt es einen Fachinformationsdienst für Pharmazie. Ein Fachinformationsdienst für Chemie befindet sich derzeit in der Konzeption.

Die heterogene Handhabung chemiebezogener Forschungsdaten erschwert die Etablierung einheitlicher FDM-bezogener Strukturen und Standards. Nachfolgend finden Sie eine Zusammenstellung von Angeboten, Tools und Diensten für das Forschungsdatenmanagement in der Chemie. Fehlt ein Angebot? Haben Sie das Gefühl, dass etwas nicht passt? Haben Sie Fragen? Wir freuen uns auf Ihre E-Mail.

Informieren und planen

Die Leitlinien der DFG zur Guten Wissenschaftlichen Praxis geben Informationen zum allgemeinen Umgang mit Forschungsdaten. Darüber hinaus hat die DFG einen Fragebogen zum Umgang mit Forschungsdaten veröffentlicht, der zur Bewertung von Anträgen verwendet wird.

Die Verwendung eines Datenmanagementplans (DMP) wird dringend empfohlen, um zu planen, wie Sie oder Ihre Forschungsgruppe mit Forschungsdaten umgehen. Darin wird festgelegt, welche Daten Sie sammeln und wie Sie dabei vorgehen werden. Außerdem wird darin dargelegt, wer Zugriff auf die Daten hat und was während und nach dem Forschungsprozess mit ihnen geschieht. Durch die frühzeitige Klärung dieser Fragen können viele Unsicherheiten bereits im Vorfeld ausgeräumt werden. Ein DMP ist kein feststehender Vertrag zwischen den beteiligten Parteien, sondern ein lebendiges Dokument, das während des Forschungsprozesses immer wieder angepasst werden sollte. Es gibt zahlreiche Leitfäden und Vorlagen zum Thema DMP. Der oben erwähnte Fragebogen der DFG zum Thema Chemie wurde in die chemiespezifische Vorlage umgesetzt, die Nutzer*innen durch die Erstellung eines Datenmanagementplans führt.

Die NFDI4Chem Knowledge Base bietet weitere Informationen und Empfehlungen zur Digitalisierung aller Schritte in der chemischen Forschung und unterstützt Forschende dabei, ihre Daten auf FAIR-konforme Weise zu veröffentlichen. Nutzerberichte zeigen, wie Open Science und Forschungsdatenmanagement gemäß den FAIR-Prinzipien umgesetzt werden können.

Tools

Chemiespezifische DMP-Vorlage auf RDMO

Chemiespezifische DMP-Vorlage als PDF auf Zenodo

Daten sammeln und organisieren

In vielen akademischen Disziplinen sind elektronische Laborjournale (ELN) ein zentrales Element des Forschungsdatenmanagements. In der Chemie können ELNs verwendet werden, um (Teile der) Laborarbeit digital abzubilden: Dazu gehören die Planungsphasen eines Experiments, der automatische Import von Messergebnissen aus kompatiblen Geräten, die Aufzeichnung chemischer Reaktionen sowie die Vervollständigung der Daten, damit sie in Repositorien exportiert und veröffentlicht werden können. Darüber hinaus ist es im Forschungsdatenmanagement unerlässlich, Ihre Daten mit Metadaten zu versehen – ELNs unterstützen ihre Nutzenden dabei oder führen dies in einigen Fällen automatisch und selbstständig durch.

Der ELN Finder bietet einen Überblick über verfügbare ELNs und hilft Anwender*innen, Dienste zu finden, die für ihre spezifischen Anforderungen geeignet sind. Darüber hinaus liefert die NFDI4Chem Knowledge Base Kriterien für die Auswahl geeigneter ELNs.

Hier sind einige Open-Source-ELNs, die auf chemiebezogene Forschung spezialisiert sind (Links führen zu Testinstanzen):

Tools

ELN Finder

NFDI4Chem Knowledge Base

Daten beschreiben und dokumentieren

Eine detaillierte Beschreibung der Speicherung Ihrer Daten ist erforderlich – idealerweise mit einer einheitlichen Struktur für Ihre Dateien und Ordner.

Bei der Arbeit mit vielen oder großen Datensätzen können die Vorteile von Datenbanken relevant werden. Wir empfehlen Ihnen zu prüfen, ob dies auf Ihr Projekt zutrifft. Weitere Informationen finden Sie in der Knowledge Base von NFDI4Chem.

Datenformate

Chemiebezogene Daten können in verschiedenen Formaten vorliegen. Ein Beispiel für menschenlesbare (Bezeichnung, Strukturdarstellung) und maschinenlesbare (SMILES, InChI, InChI-Key) Strukturinformationen ist unten für Koffein angegeben. Als zweite Dimension können wir zwischen proprietären und offenen Formaten unterscheiden. Oft erstellen Analysegeräte nur proprietäre Formate, die von Open-Source-Software nicht gelesen werden können. Konvertierungsdienste ermöglichen die Umwandlung von einem Dateiformat in ein anderes.

Tools

NFDI4Chem Converter Service

Online-Tool zum einfachen Konvertieren von Formaten

NOMAD unterstützt über 70 Parser für Dichtefunktionaltheorie (DFT) und Molekulardynamik-Codes. Diese Parser generieren hierarchische Beschreibungen von Molekülen und Monomeren, einschließlich detaillierter Schemata für quantenchemische Methoden, und extrahieren automatisch Metadaten aus Berechnungsdateien.

Metadaten

Es ist unerlässlich, Daten mit Metadaten zu beschreiben. Metadaten sind Daten über Daten oder Daten, die die Hauptdaten beschreiben. Eine NMR-Analyse umfasst beispielsweise die NMR-Dateien und Metadaten, die die Analysebedingungen wie Lösungsmittel, Instrument oder sogar den Namen von Chemiker*innen beschreiben. Während ein Mensch „John Smith“ vermutlich als Chemiker und nicht als Ausgangsmaterial erkennen würde, ist dies einer Maschine nicht möglich. Um FAIR zu sein, benötigt also jedes einzelne Datum seine eigenen Metadaten. Damit diese Metadaten von Menschen und Maschinen gleichermaßen gut verstanden werden, müssen sie standardisiert werden. Aus diesem Grund ist die Metadatenunterstützung durch ELNs und Repositorien so hilfreich. MIChIs (Minimum Information for Chemical Investigations) und ihre Formalisierung als Metadatenschemata wurden entwickelt, um Standardisierung und Reproduzierbarkeit zu gewährleisten. Mit solchen (minimalen) Metadatensätzen können wir sicherstellen, dass die Analyse-Methode für andere Forschende, die die Untersuchung replizieren möchten, verständlich ist.

MIChIs:

  • MARGARITAS (MIChI-Standard für die Berichterstattung über NMR-Experimente mit kleinen Molekülen im flüssigen Zustand; veröffentlicht)
  • UV-Vis (MIChI für Ultraviolett-Visible-Absorptionsspektrophotometrie; in Vorbereitung)

Terminology Service

Der Terminology Service ist ein Repositorium für Ontologien im Bereich der Chemie. Er ist eine zentrale Anlaufstelle für die neuesten Versionen von Ontologien und bietet Informationen zu deren Umfang, Anwendungsbereichen und Kurator*innen.

Letztendlich könnte jeder Forschende seine eigenen Metadaten erfinden, was zu gegenseitiger Unverständlichkeit führen würde. Um dies zu vermeiden, empfehlen wir die Verwendung von Terminologien, da diese strukturierte Vokabulare verwenden. In diesem Sinne schaffen Ontologien semantische Verbindungen zwischen den Begriffen. Dies macht Daten wirklich interoperabel und maschinenlesbar. Ontologien sind zwar schwer zu verstehen, aber für FAIRe Daten von entscheidender Bedeutung.

Daten veröffentlichen und archivieren

Ähnlich wie traditionelle wissenschaftliche Zeitschriften können auch Datenjournale zur Veröffentlichung von Forschungsdaten genutzt werden. In der Regel finden Peer-Reviews statt. Die meisten Datenzeitschriften werden von Verlagen herausgegeben und sind für ihre Leser*innen oder Autor*innen mit Veröffentlichungsgebühren verbunden. Nachfolgend finden Sie eine Auswahl bekannter Datenzeitschriften, die zur Veröffentlichung chemiebezogener Datensätze genutzt werden können:

Datenrepositorien sind die gängigste Methode zur Veröffentlichung von Forschungsdaten. Sie sind in der Regel mit geringen oder gar keinen Veröffentlichungsgebühren verbunden. Wir empfehlen, nach Möglichkeit fachspezifische Repositorien zu wählen, da diese die Auffindbarkeit Ihrer Daten im Vergleich zu generischen Repositorien verbessern. NFDI4Chem hat Empfehlungen zur Suche nach Repositorien und eine Auswahl relevanter fachspezifischer Repositorien zusammengestellt. Alternativ können Sie re3data nach chemiebezogenen Repositorien durchsuchen.

Darüber hinaus verbessert die Verwendung von Datenverfügbarkeitserklärungen die Auffindbarkeit der Daten, indem Manuskripte mit entsprechenden FAIRen Datensätzen in Forschungsdaten-Repositorien verknüpft werden. Dabei ist es wichtig, dass PIDs wie DOIs verwendet werden. Es kann auch repositoriumspezifische Identifikatoren oder Zugangsnummern geben.

Daten finden und nachnutzen

Der NFDI4Chem Search Service bietet eine umfassende Suche in den verschiedenen Chemie- und chemiebezogenen Repositorien der NFDI4Chem.

NOMAD bietet Forschenden leistungsstarke Such- und Erkundungstools, mit denen sie auf Millionen von Dateneinträgen in den Bereichen Physik, Materialwissenschaften und Chemie zugreifen können. Benutzer können nach chemischer Formel, Struktur, Methode oder Eigenschaft suchen und auf die strukturierten Daten oder Rohdateien zugreifen. Die interaktiven Schnittstellen unterstützen die Visualisierung, Filterung und den Vergleich von Ergebnissen, was die Identifizierung und Wiederverwendung relevanter Daten in neuen Studien erleichtert.

Zusätzlich zum generischen Erkundungsmenü bietet NOMAD spezielle Suchschnittstellen und Datenansichten über mehrere domänenspezifische Datenbanken, wie z. B. heterogene Katalyse, metallorganische Gerüste und Halogenid-Perowskit-Ionen. Diese Datenbanken unterstützen die Suche, den Vergleich und die Wiederverwendung verwandter Daten aus verschiedenen Studien und bieten Referenzdatensätze, die als Grundlage für neue Forschungsarbeiten dienen können.

Schulungsmaterialien

Schulungen

NFDI4Chem bietet kostenlose 1–2-tägige FDM- und Chemotion-Workshops an (Anfragen über den Helpdesk).

Videos

TIB-AV

NFDI4Chem auf YouTube

Weiterführende Literatur

Artikel: „Umgang mit Forschungsdaten in der Chemie
Autor*innen: Fachkollegien Chemie
Erscheinungsjahr: 2023
Link zur DFG-Website

Zitiervorschlag (Chicago)

Redaktion von forschungsdaten.info. „Forschungsdatenmanagement in der Chemie“. forschungsdaten.info, 18. November 2025. Link.