Skip to main navigation Skip to main content Skip to page footer

Kolla­bo­ra­ti­ves Ar­bei­ten

Digitale Möglichkeiten in Forschungsverbünden

Kooperative Forschungsprojekte mit mehreren Partnern zeichnen sich immer häufiger durch einen sowohl transnationalen als auch interdisziplinären Charakter aus. Dies bringt zusätzliche Herausforderungen im Management von Forschungsdaten mit sich, denen durch eine koordinierte Planung des Datenmanagements und kooperative Arbeitsweise begegnet werden kann. Die Implementierung des Datenmanagements sollte daher gemeinsam geplant und vereinbarte Vorgehensweisen und Verantwortlichkeiten in einer Projekt-Policy sowie einem Datenmanagementplan festgehalten werden. 

Zu den Herausforderungen im Management von Forschungsdaten beim kollaborativen Arbeiten zählen beispielsweise die gemeinsame Organisation und Bearbeitung von Daten und Dokumenten unter möglicherweise unterschiedlichen methodischen oder disziplinären Anforderungen. Auch das Festlegen von Standards für Ordnerstrukturen, Dateibenennung, Metadaten und Dateiformate bis hin zu ganzen Arbeitsabläufen ist dabei von grundlegender Bedeutung. Die Bereitstellung von gemeinsam genutztem Speicher sowie der Zugang zu und Transfer von Forschungsdaten zwischen verschiedenen Forschungseinrichtungen unter Berücksichtigung von Datensicherheit und Datenschutz stellen weitere Herausforderungen dar. 

Für das gemeinsame, auch ortsunabhängige wissenschaftliche Arbeiten mit Daten gibt es ein breites Feld an speziellen Werkzeugen und Tools, die vor allem durch die Dokumentation der Forschungsprozesse und Datenbearbeitung eine nachhaltige und reproduzierbare Forschung im Sinne der Regeln der Guten Wissenschaftlichen Praxis ermöglichen.

Planung der gemeinsamen Arbeit mit Daten

Für die kollaborative Arbeit mit Forschungsdaten ist aufgrund der Vielzahl von Beteiligten und Institutionen eine zentral koordinierte Planung des Forschungsdatenmanagements und aller Workflows noch wichtiger als für die individuelle Forschung. Von Beginn an sollten die grundlegenden Verantwortlichkeiten und der Umgang mit den im Forschungsprojekt entstehenden Daten in einer Projekt-Policy festgelegt werden - unabhängig von eventuell vorhandenen institutionellen oder disziplinären Policies.

Die konkreten Maßnahmen sind in einem Datenmanagementplan (DMP) festzulegen, der sich idealerweise am Datenlebenszyklus orientiert. Neben Aussagen zum Umgang mit den im Projekt entstehenden Forschungsdaten während der Projektlaufzeit enthält dieser Informationen zu den konkreten Anforderungen der Förderorganisation, Aussagen zu Urheberrecht und Rechten an geistigem Eigentum der Forschungsdaten, Vertraulichkeitsvereinbarungen sowie Richtlinien zum Umgang mit den Daten am Projektende, wie Datenveröffentlichung oder -vernichtung. Der Datenmanagementplan ist wichtig, um Daten für Dritte interpretierbar und nachnutzbar zu machen und wird daher mittlerweile von vielen Drittmittelgebern (DFG, EU Horizon 2020, Volkswagenstiftung) für die Vergabe von Mitteln aus bestimmten Förderlinien als Teil eines Förderantrags erwartet.

Gemeinsamer Datenzugriff und Data Sharing

Für das kollaborative Arbeiten ist die gemeinsame Bearbeitung von und der Zugriff auf Dateien erforderlich. Dadurch kann man viel Zeit sparen und alle Beteiligten haben automatisch immer die aktuellsten Dateiversionen vorliegen. Hierbei bestehen folgende Anforderungen:

  • Speicherung und Austausch von Dokumenten und Datendateien,
  • Die Fähigkeit, Dokumente und Dateien in Ordnern zu organisieren,
  • Ein Zutrittskontrollsystem, das die Authentifizierung und Autorisierung auf einfache Weise verwaltet,
  • Versionskontrolle von Dokumenten und Datendateien,
  • Ggf. Möglichkeit der Metadaten-Annotation bzw. Festlegung von Metadatentemplates
  • Dateisperren verhindern, so dass Benutzende gleichzeitig an derselben Datei arbeiten können
  • Wahrung des Datenschutzrechtes

Speichern gemeinsamer Daten

Ein institutionelles Laufwerk

[+] eine Institution ist zuständig für Setup, Speicherung, Sicherung und Zugangskontrolle
[+] auf einen bestimmten Teil kann über ein virtuelles privates Netzwerk (VPN) zugegriffen werden
[-] Zugriffskontrolle (evtl. schwierig zu handhaben)
[-] Externe Projektpartner bekommen evtl. keinen Zugang

Ein sicherer Datenübertragungsserver (SFTP)

[+] eine Institution ist zuständig für Setup, Speicherung, Sicherung und Zugangskontrolle
[+] integrierte Zugangskontrolle unabhängig vom Active Directory (zentralen Verzeichnisdienst) der Forschungseinrichtungen
[-] mögliche Vorbehalte, außenstehenden (der Institution nicht zugehörigen) Personen Zugang zu gewähren

Ein cloudbasierter File-Sharing-Dienst

Über Cloud-Dienste können unkompliziert und ortsunabhängig Dateien innerhalb einer Gruppe geteilt werden. Hierbei empfiehlt sich aufgrund von Datenschutzaspekten die Nutzung institutioneller Cloud-Dienste und Bundesland-Dienste, wie bwSync&Share, Sciebo oder Academic Cloud. Weitere länderspezifische Angebote finden Sie auf den Seiten der Bundesländer.

Bei kommerziellen Diensten sollten die Nutzungsbedingungen aufmerksam gelesen werden und vor allem bei außereuropäischen Cloud-Services ist aus datenschutzrechtlicher Sicht Vorsicht geboten. Alternativen zu Dropbox, Google Drive oder Microsoft Onedrive wären z. B. OwnCloud, SpiderOak, Mega.nz, Tresorit oder Wolkesicher.

[+] einfach einzurichten und zu verwenden
[-] begrenzter Speicherplatz
[-] Sicherheitsbedenken bezüglich der Aufbewahrung von Dateien und Backups

Mehr Informationen hierzu finden Sie im Themenbereich Speichern und Rechnen.

Kollaboratives Arbeiten an Dokumenten

Für kollaboratives Arbeiten ist die gemeinsame Bearbeitung von Dokumenten und Dateien unerlässliche Notwendigkeit. Dafür gibt es zahlreiche Tools und Werkzeuge wie beispielsweise:

Sie vermissen ein wichtiges Werkzeug? Nehmen Sie gerne mit uns Kontakt auf und bringen Sie Ihre Erfahrung und Ihr Wissen im Umgang mit Forschungsdaten ein. 

Tools für die Organisation wissenschaftlicher Datenarbeit

Neben den Tools für das generische Management von Daten, Dateien und Dokumenten gibt es ein breites Feld an speziellen Werkzeugen für die kollaborative wissenschaftliche Arbeit mit Daten. Mit diesen soll möglichst einfach der Forschungsalltag gestaltet werden können, indem besonders die Dokumentation der Forschungsprozesse und der Datenbearbeitung unterstützt werden, um die Nachhaltigkeit und Reproduzierbarkeit der Forschungsleistungen im Sinne der Regeln der guten wissenschaftlichen Praxis zu gewährleisten. 

Ein breites Spektrum solcher Tools hat sich vor allem in der Chemie und den Lebenswissenschaften etabliert:

Ein elektronisches Laborbuch ist eine digitale Version, sprich Softwareplattform, eines traditionellen handschriftlichen Labornotizbuchs oder Laborjournals aus Papier. Es dient der digitalen Dokumentation und Verwaltung des gesamten Forschungsprozesses von Versuchen, Messungen und Experimenten von der Planung und Durchführung bis zur Auswertung der produzierten Forschungsdaten. Daher ist es ein geeignetes Tool für die orts- und zeitunabhängige Projektarbeit. Durch die Standardisierung der Datenerfassung und Möglichkeit der direkten Anbindung von elektronischen Messgeräten zur automatischen Erfassung der Daten kann die Arbeit im Labor außerdem beschleunigt werden.

Der Schwerpunkt des Einsatzes und der Nutzung eines elektronischen Laborbuchs (ELN) liegt oft bei der Verwaltung unstrukturierter Daten von Versuchen oder Synthesen, aber auch von Rezepturen. Dabei werden Dialogformen unterstützt, welche Eingaben in angepassten Formularen, Tabellen oder großen Freitextfeldern ermöglichen, bis hin zur Erfassung von Reaktionsgleichungen oder Bildern.

Generische ELNs wie openBis und eLabFTW werden zunehmend in anderen Fachbereichen genutzt, da sie für die jeweiligen Bedürfnisse der Forschenden konfiguriert werden können.

Weitere Informationen finden Sie in unserem Artikel zu Elektronischen Laborbüchern.

Eine Sammlung zur ELB-bezogenen Fachliteratur und weiterer Informationssammlungen hat forschungsdaten.org zusammengestellt.

Weiteres zu ELNs auf LiMSwiki

Ein Laborausführungssystem (LES) ist ist eine spezialisierte Variante oder Untereinheit eines ELNs für die Qualitätskontrolle auf Arbeitsebene des Forschenden. Es wird zur Unterstützung und einer systematischen Dokumentation von allen Labortätigkeiten nach vorgegebenen Arbeitsanweisungen eingesetzt, um die Konsistenz der wiederholten Durchführungen von Tests und Messungen etc. zu gewährleisten. Dabei wird der Nutzer im Dialog mit Hinweisen oder Anweisungen geführt und gleichzeitig zur manuellen oder elektronischen Erfassung der relevanten Daten für den jeweiligen Arbeitsschritt aufgefordert. LES-Anwendungen finden sich oft in geregelten Bereichen wie der Pharmaindustrie aber auch in anderen Labors mit hohen Dokumentationsanforderungen.

Weiteres zu LES auf LiMSwiki

Ein Scientific Data Management System (SDMS) ist eine Software, die in erster Linie zur zentralen Dokumentation, Speicherung und zum Wissensmanagement in wissenschaftlichen Laboren eingesetzt wird. Mit einem SDMS können Forschende und das gesamte Laborpersonal Labordaten und Wissen besser speichern und suchen, Arbeitsabläufe und Genehmigungsprozesse beschleunigen und die Zusammenarbeit zwischen den Mitarbeiterinnen und Mitarbeitern optimieren. Es ist daher darauf ausgelegt, alle generierten unstrukturierten wie strukturierten Labordaten (Rohdaten, Ergebnisdateien, Dokumente) aus Datensystemen wie einem LIMS oder einem ELN sowie Gerätedaten zu verarbeiten und speichern. Die Softwareanwendungen sind häufig auf die geordnete Langzeitspeicherung komplexer Analysedaten wie Spektren oder Chromatogramme ausgerichtet und umfassen neben der Datenerfassung und Übernahme auch die Datenvisualisierung sowie teilweise die Erstellung von Berichten.

Weiteres zu SDMS auf LiMSwiki

Ein Labor-Informations- und Management-System (LIMS) ist ein Softwaresystem für die strukturierte Erfassung und Verwaltung von Daten sowie die Unterstützung von Arbeitsabläufen in Forschungs- und Entwicklungs-Laboren, die probenorientiert arbeiten. Sie können die Produktivität und Effizienz von Laboren verbessern, indem sie den Prozess der Erfassung von Informationen und der Verwaltung von Aufgaben automatisieren und rationalisieren. Nicht nur alle wichtigen Informationen von Proben und Experimenten, sondern auch von Laborabläufen, Geräten und Personal werden hierüber dokumentiert und verwaltet. Ein LIMS ist also eher an vordefinierten, verallgemeinerten und gleichbleibenden Arbeitsabläufen auf der Ebene der Laborleitung orientiert und dient in erster Linie der Nachverfolgung und Lokalisierung von Proben.

Weiteres zu LIMS auf LiMSwiki

Diese Tools sind spezialisiert auf die Arbeit in Laboren und mit Experimenten. Eine exakte Abgrenzung dieser Systeme ist häufig schwierig, da sie oft übergreifende Funktionalitäten aufweisen. Bei der Suche eines geeigneten Systems empfiehlt sich daher sowohl eine breiter angelegte, als auch eine gezielte Recherche in den jeweiligen Fachdisziplinen. 

Beispiele aus anderen Bereichen sind:

Git ist eine freie Software zur verteilten Versionsverwaltung von textbasierten Dateien. Git registriert Unterschiede zwischen Dateien und kann damit Veränderungen an unterschiedlichen Stellen automatisch und eigenständig integrieren. Man kann mit Git rein lokal arbeiten, um Versionen seiner Arbeit zu speichern. Durch die Einbeziehung von zentralen Servern (sog. Remote Servern) können aber auch viele Beteiligte gemeinsam an den gleichen Dateien arbeiten.
Git eignet sich daher ideal für die Versionierung bzw. das kollaborative Arbeiten im Rahmen des Forschungsdatenmanagements und der Entwicklung von Forschungssoftware. So wird es überwiegend bei der Versionsverwaltung von Software-Code eingesetzt, eignet sich aber genauso zum gemeinsamen Schreiben von LaTeX-Dokumenten oder anderen textbasierten Dateien.

GitHub, GitLab und Bitbucket sind beispielhafte Plattformen, die die Server-Seite von Git implementieren. GitHub stellt eine momentan kostenlose Plattform zur Verfügung, auf der Projekte ihre Arbeit öffentlich zur Verfügung stellen können. Mit GitLab, GitHub Enterprise oder Bitbucket kann man seinen eigenen Git-Server aufsetzen oder betreiben lassen.
In den meisten Linux-Distributionen ist Git bereits als Paket enthalten. Unter Windows können Tools wie git bash (Kommandozeilen-Tool), TortoiseGit  (Integration in den Windows-Explorer) oder auch SourceTree (grafische Benutzeroberfläche) genutzt werden.

Hier geht's zu einem Cheatsheet mit den wichtigsten Git Befehlen

Hier gibt es eine ausführliche Git Dokumentation

Wie Git im Bereich Forschungsdatenmanagement eingesetzt werden kann, zeigen die beiden Schulungsvideos „Git einrichten“ und „Git bedienen“, die im Rahmen von Forschungsdatenmanagement Bayern entstanden sind.

Hier gibt es eine Schulungseinheit zum Erlernen von Git bei den Carpentries

Hier geht's zu Spielen zum Erlernen von Git: GitHub und Learn Git Branching

mit denen Arbeitsabläufe modelliert und gesteuert werden können

Jupyter Notebooks beschreiben ein offenes Dokumentformat, in dem Text und Code-Bestandteile miteinander kombiniert werden können. Die Code-Teile können direkt ausgeführt, aber auch verändert werden. Damit können wissenschaftliche Workflows in einer dokumentierten und gleichzeitig ausführbaren Art und Weise gespeichert und zur Verfügung gestellt werden. Jupyter Notebooks können lokal installiert und ausgeführt oder auch auf einem zentralen Server (einem Jupyter Hub) hinterlegt werden.

Ein Jupyter Lab kann als interaktive Entwicklungsumgebung für Notebooks, Code und Daten verwendet werden.

Hier geh'ts zu einer ausführlichen Dokumentation

Hier geht's zu einem Tutorial für Forschende

Darüber hinaus vereinen Virtuelle Forschungsumgebungen (VFU) fachspezifische Tools, Toolsammlungen, Arbeitsumgebungen und Daten für eine ortsunabhängige Zusammenarbeit zwischen Wissenschaftlerinnen und Wissenschaftlern eines bestimmten Forschungsverbunds oder einer bestimmten Forschungscommunity.

In der Verbundforschung ist der Austausch von Informationen notwendig. Dokumente und Daten müssen oft in einer kontrollierten und organisierten Art und Weise über mehrere Organisationen oder Forschungseinrichtungen verwaltet werden. Wird die Verwaltung vernachlässigt, kann dies viel zusätzliche Arbeit nach sich ziehen. Eine Lösung für diese Anforderungen bieten Virtuelle Forschungsumgebungen (VFU). Darunter versteht man Softwarelösungen oder webbasierte Plattformen, die Forschenden eine ortsunabhängige Zusammenarbeit ermöglichen.
In den letzten Jahren haben viele Hochschulen und/oder deren Serviceeinrichtungen sowie Forschungsverbände und Arbeitsgruppen Projekte zur Entwicklung Virtueller Forschungsumgebungen aufgesetzt bzw. bereits abgeschlossen.

Einige Beispiele für fachspezifische VFUs finden Sie auf der Länderseite von Baden-Württemberg, wo von 2016 bis 2019 mehrere Projekte gefördert wurden, oder unter den jeweiligen Disziplinen.