Am Puls der Wissenschaften mit KATI

Von der Idee zum Programm – ein Rückblick auf fast sieben Jahre KATI

Im Rahmen der Technologiefrühaufklärung hat das Fraunhofer INT seit Jahren eine Art Science Observatory etabliert. Das heißt, dass möglichst alle Wissenschafts- und Technologiefelder kontinuierlich beobachtet werden, um auf neue technologische Entwicklungen, aber auch Durchbrüche in bereits identifizierten Themen aufmerksam zu werden. Die zentrale Informationsquelle für diesen Prozess sind wissenschaftliche Publikationen und Patente. Als vor einigen Jahren das Thema Cognitive Computing gehypt wurde, entstand am Fraunhofer INT die Idee, diesen Ansatz für die Technologiefrühaufklärung nutzbar zu machen. Dies war die Geburtsstunde des KATI-Systems. 

Heute, einige Jahre und viele Stunden des Entwickelns, Programmierens und Testens später ist aus der anfänglich eher vagen Idee mit KATI ein wichtiges Tool für die tägliche Arbeit der Wissenschaftler*innen am Fraunhofer INT geworden. Und nicht nur dort wird KATI genutzt – seit letztem Jahr steht das System allen Mitarbeitenden in der Fraunhofer-Gesellschaft zur Verfügung. Zusätzlich ist mit Unterstützung der Förderung durch das Bundesamt für Ausrüstung, Informationstechnik und Nutzung der Bundeswehr (BAAINBw) mit dem Thema Data Driven Foresight ein neues Forschungsfeld entstanden, mit dem sich das KATI Lab befasst. Zentrale Fragestellung dieses Themenfeldes ist, wie man Foresight-Prozesse durch die Nutzung von Daten besser, effektiver und einsichtsvoller gestalten kann. KATI ist also gewissermaßen ein Tool für Data Driven Foresight, welches sich auf Publikationen und Patente als Datenquellen fokussiert. 

 

Daten – sehr, sehr viele Daten 

Als KATI im August 2017 das erste Mal einer breiteren Öffentlichkeit vorgeführt wurde, enthielt die Datenbank knapp 60 Millionen Publikationen. Im Laufe des Jahres 2024 wird die Marke von 80 Millionen Publikationen überschritten werden. Eine wichtige Designentscheidung war, diese Daten mittels einer sogenannten Graphdatenbank zu erschließen. Das Datenmodell, das vom KATI-Team bereits in einer sehr frühen Phase des Projektes entwickelt wurde, hat sich seitdem sehr gut bewährt. Zum einen lässt es sich auch für andere Datenquellen anpassen. Dazu zählen beispielsweise die Publikationsdaten von Dimensions oder auch Patente. Zum anderen vereinfacht dieser Ansatz eine Vielzahl von Analysen und erleichtert die explorative und interaktive Datenanalyse. 

Im Rahmen der Entwicklung des KATI-Systems setzt das Team auf eine enge Verzahnung mit konkreten Fragestellungen und Use Cases der Nutzer*innen, wie sie sich aus der täglichen Arbeit in den diversen Projekten ergeben. Im Zentrum steht also weniger die Frage, was man noch machen könnte, sondern was gebraucht wird, um einen Foresight-Prozess möglichst effizient zu begleiten. Das wirkt sich auf mehreren Ebenen aus.

 

Der Entwicklungsprozess 

Zum einen ergeben sich daraus spezifische Analysen, die im System implementiert sind. Ein solcher exemplarischer Use Case ist die Frage, welche Publikationen man lesen sollte, um sich möglichst schnell und umfassend in ein Thema einzuarbeiten. Um solche sogenannten Schlüsselpublikationen zu identifizieren, wurde der Reference Citation Plot implementiert, der sich als sehr nützlich erwiesen hat. Andere Use Cases betreffen beispielsweise die Themen Akteursanalyse oder die Identifikation möglicher neuer Anwendungsfelder.

Dieser Use-Case-spezifische Ansatz wird durch die flexible Benutzeroberfläche noch zusätzlich unterstützt. Diese erlaubt es nämlich, sich einzelne Sichtweisen auf ein Thema ganz spezifisch zusammenzustellen. Sollen beispielsweise die Forschungsschwerpunkte einer bestimmten Institution analysiert werden, so kann das entsprechende Balken-Diagramm als Filter genutzt werden, um die Keywords zu den Publikationen einer Institution zu analysieren und so einen Einblick in deren Forschungsschwerpunkte zu generieren. 

Schließlich spielen die Bedarfe der User auch bei der Gestaltung der graphischen Benutzeroberfläche eine zentrale Rolle. Neben einem ansprechenden Design steht hier die einfache und intuitive Bedienbarkeit im Fokus der  Entwicklungsarbeit des KATI-Teams. Damit soll erreicht werden, dass das KATI-System seinen Nutzer*innen einen möglichst großen Mehrwert liefert. Ein aktuelles Beispiel hierfür ist die Implementierung eines Query Editors. Dieser bietet die visuelle Möglichkeit, mittels Drag & Drop die umfassenden Suchoptionen des KATI-Systems zu nutzen. Auf diese Weise werden die Nutzer*innen in die Lage versetzte komplexe Suchanfragen einfach und intuitiv zu gestalten. 

 

Ausblick

Das KATI-System wird im Jahr 2024 seinen siebten Geburtstag feiern. Die Entwicklung ist aber längst noch nicht abgeschlossen, sondern wird stetig vorangetrieben. Neben der kontinuierlichen Erweiterung des Methodenportfolios steht hier die Erschließung weiterer Datenquellen im Fokus. Und mit den Large Language Modellen gibt es bereits den nächsten Hype im Bereich der KI-Forschung, dessen Nutzung für die Technologiefrühaufklärung eine spannende wissenschaftliche Fragestellung darstellt, die auch für die Entwicklung des KATI-Systems von Bedeutung ist.