Zum Hauptinhalt springen

Daten-Steward

Die Rolle des Datenverwalters ist in der Forschung relativ neu und befindet sich daher noch in der Entwicklung und Definition. Im Jahr 2019 wurde im Abschlussbericht des niederländischen Projekts mit dem Titel Towards a community-endorsed data steward profession description for life science research die Datenverwaltung wie folgt definiert:

"Datenverwaltung ist die verantwortungsvolle Planung und Durchführung aller Aktionen mit digitalen Daten vor, während und nach einem Forschungsprojekt, mit dem Ziel, die Nutzbarkeit, Wiederverwendbarkeit und Reproduzierbarkeit der resultierenden Daten zu optimieren."

Aus dieser Definition ergibt sich, dass ein Datenverwalter im weitesten Sinne damit beschäftigt ist, die Qualität der Forschungsdaten während des gesamten Lebenszyklus der Forschungsdaten durch Anwendung der FAIR Data Principles sicherzustellen.

Aufgaben und Fertigkeiten

Die Aufgaben eines Datenverwalters können verschiedene Formen annehmen, oft abhängig von der genauen Position innerhalb der Organisation und den persönlichen Fähigkeiten und dem Hintergrund der Person. Zu den Aufgaben kann es gehören, geeignete Repositorien für Datenpublikationen zu definieren, über Datenformate und Metadaten zu beraten, Systeme zur Datendokumentation und Metadatenverwaltung einzurichten, z. B. durch einen elektronischen Laborjournal. z. B. durch ein elektronisches Laborjournal (ELN), und die Schulung von Forschern in bewährten Verfahren. Im Engaging Researchers with Data Management: The Cookbook werden die verschiedenen Aufgaben und Fähigkeiten für die Rolle des Datenverwalters näher erläutert. Darin beschreibt Alastair Dunning, der Leiter der Research Data Services an der TU Delft, mit den Worten zitiert:

"Zwischenmenschliche Fähigkeiten sind der Schlüssel zum Erfolg des Data Steward."

Dies zeigt, wie wichtig die Kommunikationsfähigkeiten eines Datenverwalters sind.

Datenverwalter können direkt an einem Institut arbeiten, aber in Deutschland sind viele von ihnen Teil größerer Verbundprojekte wie Sonderforschungsbereiche oder sogar Teil verschiedener NFDI-Konsortien. Sie übernehmen oft die Rolle, die Bedürfnisse und Anforderungen einer bestimmten Forschungsgemeinschaft zu kommunizieren, so dass Entwickler in IT-Zentren, Universitätsbibliotheken, ELN-Anbietern und der NFDI maßgeschneiderte Lösungen für digitale Forschungsdaten erstellen können. In dem oben erwähnten Kochbuch werden mehrere Strategien zur Entwicklung und Einsetzung von Datenverwaltern skizziert. Eines der vorgestellten Modelle ist der "rent-a-data-steward", der sich von den gängigen Modellen unterscheidet. Hier sind die Datenverwalter nicht dauerhaft in den Instituten angesiedelt, sondern werden für einen bestimmten Zeitraum an die Institute, Projekte etc. "ausgeliehen".

Um Daten effizient zu verwalten und den Überblick zu behalten, können Datenverwalter einen Datenverwaltungsplan als unterstützendes Instrument verwenden.

Kürzlich hat ein BMBF-gefördertes Projekt mit dem Titel DataStew das Konzept der Datenverwaltung in der deutschen Hochschullandschaft analysiert und verschiedene Anforderungen der Interessengruppen identifiziert, um Empfehlungen für die Ausbildung und Schulung für diese Rolle geben zu können. Ähnlich wie im oben erwähnten niederländischen Projekt zeigen die ersten Ergebnisse hier die vielfältigen Aufgabenbereiche von Datenverwaltern auf. Von der Beratung zu allgemeinen FDM-Diensten, der Entwicklung oder dem Ausbau von IT-Tools und Infrastruktur für FDM in der Forschung, der disziplinspezifischen Beratung, der Durchführung eigener datenfokussierter Forschung für bestimmte Disziplinen bis hin zur Übernahme von Koordinationsfunktionen gleicht selten eine Datenverwalterposition der anderen.

Datenverwalter in der Chemie

Chemische Forschung ist oft eine Kombination aus Beobachtungsdaten und digitalen Daten. Während der Schwerpunkt bei FDM und Data Stewardship in der Regel auf letzteren liegt - wie in der eingangs zitierten Definition betont -, kann der Aspekt der Beobachtungsdaten nicht ignoriert werden. Traditionell werden diese Informationen in handschriftlichen Laborprotokollen festgehalten. Hier müssen die Datenverwalter die Art der durchgeführten Laborarbeit verstehen und bei der Auswahl geeigneter ELNs zur Digitalisierung dieser Art von Informationen helfen. Für digitale Daten müssen die Datenverwalter die gemeinschaftsspezifischen Standards für Datenformate und Mindestinformationen (MI) zu Metadaten kennen. Mit diesem Wissen können sie bei der effizienten Implementierung von Daten-Workflows helfen, die den Datentransfer vom Gerät zu sicheren Speicherorten, die Konvertierung von Datenformaten und die Beschriftung von Metadaten automatisieren. Zum Beispiel kann Chemotion ELN's Geräteintegration solche Arbeitsabläufe erleichtern, während die Daten direkt mit den im ELN aufgezeichneten Molekülen und Reaktionen verbunden werden. Solche Prozesse ermöglichen die Veröffentlichung eines gut dokumentierten Datensatzes in Repositorien neben den in Zeitschriftenartikeln berichteten Ergebnissen.

Vernetzung und kontinuierliche Weiterbildung

Aufgrund ihres breiten Aufgabenspektrums engagieren sich Datenverantwortliche kontinuierlich für die Vernetzung, den Austausch und die Weiterentwicklung des eigenen Wissens über FDM-Ansätze, Best Practices, Tools und Services. Die RWTH Aachen veranstaltet beispielsweise ein monatliches Open RDM Network Meeting, das sich an Datenverantwortliche richtet, während staatliche Initiativen wie fdm.nrw verschiedene Vernetzungs- und Schulungsmöglichkeiten anbieten. NFDI4Chem organisiert auch eine Workshop-Reihe für Einsteiger mit dem Titel FAIR Research Data Management: Basics for Chemists, die sich an Forscher und Datenverwalter gleichermaßen richtet und sich mit Konzepten und Werkzeugen des Forschungsdatenmanagements in der Chemie beschäftigt.

Quellen und weitere Informationen