Die datengesteuerte Forschung in der Materialwissenschaft erfordert eine zuverlässige und flexible Infrastruktur, die in der Lage ist, verschiedene experimentelle Daten zu verwalten. Innerhalb des Lehrstuhls Materials Discovery and Interfaces hat sich die Data Science Group verpflichtet, den gesamten Lebenszyklus der Datenwissenschaft zu unterstützen. Dies reicht von der anfänglichen Sammlung von Rohdaten bis hin zum Einsatz von Vorhersagemodellen, die auf kuratierten, integrierten Datensätzen trainiert werden. Die Arbeit der Gruppe basiert auf der Entwicklung flexibler und erweiterbarer Softwareplattformen, die auf die spezifischen Bedürfnisse des Hochdurchsatz-Materialscreenings und der Forschung am MDI zugeschnitten sind, sowie auf der Wartung der unterstützenden Infrastruktur, sowohl der Hardware als auch der Software.
Ein zentraler Schwerpunkt der Gruppe ist das Forschungsdatenmanagement - die Entwicklung und Implementierung von Softwaresystemen, die sicherstellen, dass Forschungsdaten auffindbar, zugänglich, interoperabel und wiederverwendbar bleiben. Wir entwickeln das MatInf Research Data Management System, eine flexible und erweiterbare Plattform, die es Forschern nicht nur ermöglicht, Daten effizient zu erfassen und zu verarbeiten, sondern auch ihre Qualität, Konsistenz und Sicherheit während ihres gesamten Lebenszyklus zu gewährleisten. Spezielle Tools für die Datenanalyse und -visualisierung werden als modulare Erweiterungen entwickelt, die sich nahtlos in die RDMS-Webanwendung integrieren lassen und eine reibungslose und kohärente Benutzererfahrung gewährleisten. Diese Arbeit umfasst die Definition von Richtlinien zur Datenverwaltung, die Implementierung von Validierungs- und Standardisierungsverfahren zur Überwachung der Datenqualität und die Gewährleistung eines sicheren, rollenbasierten Zugriffs auf sensible Datensätze. Parallel dazu sind wir für die Erhaltung von Metadaten, die Verfolgung der Datenherkunft und die Unterstützung der langfristigen Nutzbarkeit und Transparenz von Daten verantwortlich.
Ein weiterer wichtiger Aspekt der Arbeit der Gruppe ist die Integration von Daten aus heterogenen Quellen, einschließlich einer Vielzahl von Hochdurchsatz-Synthese- und Charakterisierungsinstrumenten, die auf (halb-)autonome experimentelle Plattformen ausgeweitet werden. Unsere Infrastruktur unterstützt die nahtlose Konsolidierung dieser Daten in einheitliche, konsistente Datensätze, die sich für fortgeschrittene Analysen eignen. Darüber hinaus unterstützen wir externe Forschungsteams durch die Bereitstellung von APIs, Werkzeugen und interaktiven Umgebungen, die die Datenerforschung und -interpretation erleichtern und sowohl die Zugänglichkeit als auch die wissenschaftliche Stringenz fördern.
Die Gruppe betreibt eine völlig autonome Full-Stack-Infrastruktur und verwaltet physische Server und Netzwerke, während sie gleichzeitig domänenspezifische Softwarelösungen entwirft, erstellt und einsetzt. Diese Unabhängigkeit ermöglicht ein schnelles Prototyping und die kontinuierliche Entwicklung von Plattformen, die genau auf die sich entwickelnden Anforderungen der materialwissenschaftlichen Forschung abgestimmt sind, ohne sich ausschließlich auf generische Lösungen von der Stange zu verlassen. Um die langfristige Nachhaltigkeit der Daten zu unterstützen, arbeiten wir mit NFDI-Initiativen zusammen, darunter FAIRmat (für die Integration mit NOMAD), NFDI-MatWerk (zur Schaffung semantischer Interoperabilität) und Coscine (für die langfristige Datenarchivierung).
Durch die Kombination von strategischer Führung bei der Verwaltung von Hochdurchsatzdaten mit dem Schwerpunkt auf experimentellen Daten und dem Ziel, Rechen- und experimentelle Daten zu verschmelzen, mit fundiertem technischem Fachwissen in der Software- und Infrastrukturentwicklung spielt die Gruppe eine Doppelrolle. Auf der einen Seite definieren und implementieren wir Forschungsdatenstrategien und bewährte Verfahren, auf der anderen Seite sind wir direkt an der Konzeption, dem Einsatz und der langfristigen Unterstützung der technischen Systeme beteiligt, die diese Strategien zum Leben erwecken.
Diese kombinierte Perspektive spiegelt sich in MatInf wider, das als Eckpfeiler unserer Vision einer umfassenden Plattform zur Integration von Materialdaten dient. Diese Plattform, die auf unserem hauseigenen Forschungsdatenmanagementsystem aufbaut, spiegelt sowohl den wissenschaftlichen Anspruch als auch die technische Grundlage unserer Arbeit wider.