Umgang mit Unternehmensdaten planen
Unternehmensdaten haben großes Potenzial für die Forschung, da sie einzigartige Einblicke in Unternehmensverhalten, Marktdynamiken und Innovationsprozesse ermöglichen. Der Zugang zu solchen Daten bleibt jedoch für Forschende aufgrund rechtlicher, technischer und vertraulichkeitsbezogener Hürden eine große Herausforderung. Diese Barrieren zu überwinden ist entscheidend, um neue Erkenntnisse zu gewinnen, die Politik und unternehmerische Entscheidungen gleichermaßen informieren können. Unternehmensbezogene Daten lassen sich in zwei Hauptkategorien unterteilen[1]:
- Daten über Unternehmen, die Kenngrößen zu Unternehmen (bspw. Branche, Größe, Erfolgskennzahlen etc.) darstellen. Die Daten werden zum Zwecke der Berichterstattung erhoben, etwa von der amtlichen Statistik, aus Behördenregistern oder durch gewerbliche Anbieter. Auch Unternehmensbefragungen wie die ifo-Konjunkturumfrage fallen in diese Kategorie. Diese Daten bilden Unternehmensprofile in unterschiedlichen Dimensionen ab.
- Daten von Unternehmen, beispielsweise Nutzungsdaten aus sozialen Medien, Transaktionsdaten aus dem Finanzsektor oder Daten aus Geschäftsprozessen. Auch Mobilitäts-, Telekommunikations- oder Personaldaten zählen dazu.[2] Diese Daten werden ursprünglich nicht für Forschung oder Berichtspflichten erhoben, sondern fallen in Unternehmensprozessen an, ohne dass dafür gesonderte Prozesse aufgesetzt werden. Die Daten sagen ggf. kaum etwas über das Unternehmen selbst aus.
Daten, die in Unternehmensprozessen entstehen (prozessgenerierte Unternehmensdaten wie unter 2. angeführt), können eine exzellente Grundlage für viele wissenschaftliche Forschungsprojekte sein. Im Umgang mit dieser Kategorie von Daten sind jedoch einige Aspekte zu berücksichtigen. So gilt es Aspekte zur Datensicherheit, Vertraulichkeit sowie Datenqualität und Kompatibilität zu adressieren. Dieser Beitrag skizziert Chancen, Herausforderungen und Lösungen im Umgang mit diesem Datentyp. Hierbei wird auf die Erfahrungen aus dem KonsortSWD-Projekt Access-to-Firm Data zurückgegriffen. Ausführliche Hilfsstellung zu Daten, die in Unternehmensprozessen entstehen, finden Sie unter anderem in der folgenden Publikation:
Breidenbach, P., Heinze, I., Raatz, I., Rujan, C. & Wichert, S. (2025). Handbook on Best Practices for Accessing Data through Firm Collaborations – Version 1.0. KonsortSWD - NFDI4Society. https://doi.org/10.5281/zenodo.17077319
Dieser Beitrag beleuchtet ausgewählte Aspekte im Umgang mit Unternehmensdaten. Die Darstellung ist nicht abschließend, sondern legt den Schwerpunkt auf Fragestellungen aus den Sozial- und Wirtschaftswissenschaften. Ihnen fehlt ein Angebot? Sie finden Zusammenhänge nicht ganz richtig dargestellt oder haben Fragen? Wir freuen uns auf Ihre Mail.
1. Datensicherheit und Vertraulichkeit
Der Schutz vertraulicher Informationen vor unbefugtem Zugriff ist unerlässlich. Dies gilt sowohl für die Wissenschaft als auch für die Unternehmen. Entsprechend sollten vor Beginn des Datenteilens zwischen Wissenschaft und Unternehmen klare Vereinbarungen getroffen werden wer, wie und wo mit den Unternehmensdaten arbeiten darf. Diese Vereinbarungen sollten auch Aussagen zur Datenaufbewahrung, -verarbeitung und -anonymisierung beinhalten. Idealerweise sollte die Vereinbarung Regelungen enthalten, inwiefern Ergebnisse aus der Datenanalyse publiziert werden können und die Daten selbst in anonymisierter Form veröffentlicht oder zumindest – zur Sicherstellung der Reproduzierbarkeit der Ergebnisse (vgl. nächsten Abschnitt) – aufbewahrt werden können. Entsprechend können die Daten spezifischen Geheimhaltungs- und Vertraulichkeitsklauseln unterliegen, die das datengebende Unternehmen auferlegt, um sein Geschäftsmodel beziehungsweise Betriebsgeheimnisse zu schützen (vgl. hierzu auch 3. Unterschiedliche Ziele und Prioritäten). Eine gängige Form dieser Vereinbarung ist beispielsweise ein Non-disclosure agreement (NDA). Hierbei können die NDAs stark in Art und Umfang der getroffenen Vereinbarungen variieren und werden oft an den Einzelfall typische Aspekte angepasst.
Sie können sich dabei an der folgenden Vereinbarung orientieren:
Federal Ministry for Economic Affairs and Climate Action (BMWK). (2022). Model agreements for research and development cooperation guidelines for cooperation between science and industry. 4th edition 2022.
2. Rechtliche und ethische Rahmenbedingungen
Wissenschaftliche Institutionen unterliegen strengen ethischen Standards und rechtlichen Vorgaben, insbesondere beim Umgang mit personenbezogenen Daten. Die Einhaltung von Datenschutzgesetzen (z. B. DSGVO) muss entsprechend klar geregelt werden. Weitere Informationen zu diesen Themengebieten finden Sie in unseren Sektionen Rechte und Pflichten sowie Ethik und Gute Wissenschaftliche Praxis.
Auch Daten von Unternehmen können sensible Informationen enthalten, die unter die DSGVO fallen. So können Daten von Online-Plattformen, die Stellenanzeigen inserieren, z. B. Kontaktdaten der jeweiligen Ansprechperson der Stellenanzeige beinhalten. Entsprechend gilt es abzuwägen, inwieweit die Datenverarbeitung unter die DSGVO fällt.
Zudem sollte auch im Sinne der Guten Wissenschaftlichen Praxis bedacht werden, dass die Datengrundlage, auf der die Ergebnisse wissenschaftlicher Arbeiten entstanden sind (z. B. Promotionsarbeiten), für mindestens 10 Jahre sicher aufbewahrt wird, um die Reproduktion der wissenschaftlichen Ergebnisse zu gewährleisten. Insbesondere dieser Aspekt sollte mit dem datenteilenden Unternehmen sowie ggf. mit der Datenschutzstelle und der Ethikkommission der Einrichtung der forschenden Person gut abgestimmt sein. Ein weiterer wichtiger Aspekt ist die Regelung von möglichen Verwertungsrechten an den Daten und/oder Ergebnissen. Hierbei sollte gewährleistet sein, dass die wissenschaftlichen Ergebnisse unabhängig im Sinne der Wissenschaftsfreiheit entstanden sind (vgl. hierzu nächstes Kapitel).
3. Unterschiedliche Ziele und Prioritäten
Wissenschaftler*innen und Unternehmen haben oft unterschiedliche Ziele: Während Unternehmen gewinnorientiert operieren und hierdurch ihre Geschäftsmodelle schützen und Betriebsgeheimnisse wahren müssen, sind wissenschaftliche Einrichtungen an Transparenz der Datengrundlage und des wissenschaftlichen Vorgehens interessiert. Diese Divergenz kann zu Missverständnissen und Spannungen in der Zusammenarbeit führen, insbesondere wenn Daten geteilt werden sollen, die Aufschluss über das Geschäftsmodell geben können oder dem Unternehmen selbst Schaden zufügen (schlechtes Image). Gleichwohl sind die Einschränkungen der bearbeitbaren Forschungsfragen aber mit dem Grundprinzip der Forschungsfreiheit schwer zu vereinbaren. Aus der Kooperationspraxis darf auch kein Anhaltspunkt für die Kritik entstehen, dass Unternehmen Daten nur für Kooperationen bereitstellen, die das Unternehmensimage positiv beeinflussen sollen. Ein solches wissenschaftliches „Whitewashing“ würde der wissenschaftlichen Integrität langfristig substanziell Schaden zufügen. Es gilt, ein Gleichgewicht zwischen den Interessen der Unternehmen und der akademischen Freiheit zu finden, um die Qualität und Glaubwürdigkeit der Forschung zu gewährleisten. Es gilt folglich, eine Win-Win-Situation zu schaffen, die Interessen beider Seiten zu berücksichtigen, mögliche Kosten des Datenteilens zu reduzieren und Mehrwerte zu schaffen. Nur so können nachhaltige und vertrauensvolle Kooperationen entstehen, die beiden Seiten zugutekommen.
Die Möglichkeit besteht beispielweise darin, ältere Daten für Forschungsdatenkooperationen zu nutzen und so beispielsweise das Spannungsfeld im Sinne einer Win-Win-Situation aufzulösen. Während Unternehmen ihre Daten am aktuellen Rand bestmöglich für neue Prozesse aufbereiten wollen, stehen für Forschende vielfach lange (in die Vergangenheit reichende) Zeitreihen und entsprechende konsistente Datenaufbereitungen im Fokus.
Unterschiedliche Fachjargons und Denkweisen können die Verständigung zudem erschweren. Die Zusammenarbeit zwischen Wissenschaftler*innen und Unternehmensvertreter*innen erfordert daher oft eine interdisziplinäre Kommunikation. Hierbei gilt es, klar zu kommunizieren für welchen Zweck Daten genutzt werden beziehungsweise welche wissenschaftliche Fragestellung damit beantwortet werden soll. Zudem sollte auf den möglicherweise langwierigen akademischen Publikationsprozess eingegangen werden, um frühzeitig entsprechendes Erwartungsmanagement zu betreiben.
4. Datenqualität und -kompatibilität
Die Datenqualität von Unternehmensdaten kann variieren, was zu Herausforderungen bei der Analyse und Interpretation führt. Aus Sicht von Unternehmen sind Unternehmensdaten prinzipiell nicht zur Nachnutzung in wissenschaftlichen Kontexten gedacht, sondern dienen der Durchführung interner Geschäftsprozesse. Der Zweck der Datenerhebung ist in der Regel nicht darauf ausgelegt, spätere Forschungsarbeiten mit ihnen durchzuführen. Dies kann einen Einfluss darauf haben, in welcher Struktur die Daten vorliegen, mit welchen Metadaten sie angereichert sind und wie konsistent die Daten über die Zeit sind. Entsprechend gilt es den Kontext der Datenentstehung im Rahmen der Forschungsarbeit zu berücksichtigen.
Darüber hinaus gilt zu berücksichtigen, dass mitunter proprietäre Datenformate auf Grund der Nutzung unterschiedlicher Systeme (Buchführungs-, Personalmanagementsystem, Warenwirtschaftssystem) genutzt werden. Hier kann es zu Kompatibilitätsproblemen kommen, wenn diese Datenformate in Forschungsprojekten außerhalb des Unternehmens genutzt werden. Eine weitere Herausforderung kann in einer für die Wissenschaft lückenhaften Datendokumentation bestehen, wenn die Unternehmensdaten für wissenschaftliche Zwecke nur unzureichend mit Metadaten versehen sind oder gar keine Dokumentation der Datenentstehung vorliegt.
Ein zentraler Aspekt beim Zugang zu unternehmensbezogenen Forschungsdaten kann der hohe Aufwand, der Unternehmen bei der Datenaufbereitung und -bereitstellung sein. Diese Aufwände müssen offen thematisiert und realistisch eingeschätzt werden, um eine nachhaltige Zusammenarbeit zu ermöglichen. Gleichzeitig stehen Forschende vor der Herausforderung, geeignete Finanzierungsquellen für die Übernahme oder Kompensation dieser Aufwände zu finden – ein Aspekt, der in der Förderlandschaft bislang oft unterbeleuchtet bleibt.
5. Datenkuration an Forschungsdatenzentren (FDZen)
Zusammenarbeit mit Unternehmen findet in der Forschung immer häufiger statt. Zumeist sind die Kooperationen an spezifische Forschende und Forschungsprojekte gekoppelt. Die Daten sind dann nicht für eine Nachnutzung vorgesehen und können die Wissenschaft nicht nachhaltig voranbringen. Verschiedene FDZen wollen diese Kurzfristigkeit überwinden und in eine nachhaltige Datenbereitstellung überführen. Forschende können sich hinsichtlich einer möglichen Datenbereitstellung an FDZen wenden. Je früher ein FDZ dabei in die Zusammenarbeit eingebunden wird, desto besser kann die Unterstützung durch das FDZ gelingen. Alle genannten Aspekte – von rechtlichen Rahmenbedingungen über Datenschutz bis hin zur Datenqualität – müssen während des gesamten Forschungsprozesses beachtet und in die Datenkuratierung sowie die spätere Nachnutzung systematisch einbezogen werden. In dem komplexen Umfeld übernehmen FDZs eine Vermittlerrolle: sie sichern eine rechtskonforme Nutzung, entwickeln passende Kurationsstrategien und unterstützen Forschende mit Beratung. Das LMU-ifo Economics & Business Data Center (EBDC) und das FDZ Ruhr am RWI zeigen, wie erfolgreich Kooperationen mit Unternehmen zur Nutzung von Unternehmensdaten sein können. Mit ihrer Expertise werden diese Daten wissenschaftlich nutzbar und sie bieten durch ihre dauerhafte Struktur Kontinuität, Vertrauen und technische Infrastruktur. So entstehen nachhaltige Datenpartnerschaften trotz sensibler Rahmenbedingungen.
Wegen der unübersichtlichen Rechtslage, Wahrung von Betriebsgeheimnissen und Geschäftsprozessen, restriktiven Lizenzbedingungen und damit verbundenen spezifischen Herausforderungen bei der Datenkuration stellen Unternehmensdaten sowohl für Forschende als auch für Forschungsdatenzentren besondere Anforderungen dar. Ein Unterstützungsangebot für Forschende bieten unter anderem die Helpdesks der Konsortien BERD@NFDI und KonsortSWD der Nationalen Forschungsdateninfrastruktur (NFDI).
Es ist angeraten, entsprechende Angebote wahrzunehmen, um keine unerwünschten Nebeneffekte zu erzeugen. Mehr Informationen zu den Besonderheiten der Datenkuration von Unternehmensdaten finden Sie unter Forschungsdatenmanagement: Kompetenzen für die Datenkuratierung - RDM Compas und unter FDM-Besonderheiten zu Unternehmensdaten - RDM Compas.
6. Projekte und Initiativen zu dem Thema
Data Group business2science: Mit der Data-Group business2science hat der Stifterverband eine Initiative ins Leben gerufen, in der Unternehmen und Wissenschaftseinrichtungen gemeinsam aktiv an der Weiterentwicklung und Gestaltung der Daten(nach)nutzung arbeiten.
NFDI-Sektion Industry Engagement: Wirtschaft und Wissenschaft bringen jeweils Datenbestände und methodische Ansätze ein, die für die jeweils andere Domäne eine hohe Relevanz aufweisen. Die Sektion Industry Engagement fördert daher Kooperationen zwischen Unternehmen, NFDI-Konsortien und weiteren Akteuren. Ziel ist es, den Austausch zu erleichtern, gemeinsame Problemfelder zu identifizieren und Kooperationen zu vereinfachen.
KonsortSWD Measure Access-to-Firm Data: Ziel dieses Projektes ist es, Kooperationserfahrungen zwischen Wissenschaft und Unternehmen zu sammeln, diese zu teilen und Forschenden Hilfestellungen mit Blick auf den Umgang mit Unternehmensdatenkooperationen an die Hand zu geben. Zudem sollen Unternehmensdatenkooperationen begründet werden, die eine FAIRe Nachnutzung ermöglichen. Das Projekt wird vom LMU-ifo Economics & Business Data Center (EBDC) und dem FDZ Ruhr am RWI durchgeführt
BERD@NFDI baut eine Anbahnungsplattform für diese Kategorie von Daten auf.
Quellen
[1] Gottschalk, S., Krolage, C., Licht, G., Peichl, A., Schaffner, S., & Wichert, S. (2023). Unternehmensdaten: Nutzbarkeit verbessern. Wirtschaftsdienst, 103(11), 750–753. https://doi.org/10.2478/wd-2023-0208
[2] Gottschalk et al., 2023, S. 750
Weiterführende Literatur
Verhaltenskodex: "Code of practice on industry-academia co-creation for knowledge valorisation."
Autor*innen: Europäische Kommission
Zuletzt abgerufen am: 03.04.2025
Link zum Dokument
Whitepaper: "A Conceptualization of Research Data in the Context of Industry-Academia Collaborations."
Autor*innen: Florian Stahl, Kai Hoff, Andreas Hamann, Christian Busse, Barbara Ebert, Juliane Fluck, Andreas Förster, Georg Rehm, Bernhard Seeger, Sylvia Thun.
Erscheinungsjahr: 2025
https://doi.org/10.5281/zenodo.14938080
Handreichung: “Research Ethics and New Forms of Data for Social and Economic Research.”
Autor*innen: OECD
Erscheinungsjahr: 2016
https://doi.org/10.1787/5jln7vnpxs32-en
Handreichung: "Hinweise zur Aufbereitung quantitativer Daten."
Autor*innen: Thomas Ebel, Jessica Trixa
Erscheinungsjahr: 2015
https://doi.org/10.21241/ssoar.43223
Zitiervorschlag (Chicago)
Redaktion von forschungsdaten.info. „Umgang mit Unternehmensdaten“. forschungsdaten.info, 07. Oktober 2025. Link.