Knowledge Analytics for Technology and Innovation
Woher kommen eigentlich all die Themen und Informationen, die das Fraunhofer INT regelmäßig in diesem Newsletter präsentiert? Verkürzt gesprochen wurden diese mit Hilfe des Science Observatory, welches die Abteilung TASP in den letzten Jahrzehnten etabliert hat, entdeckt. Darunter versteht man den Ansatz, möglichst alle Bereiche von Naturwissenschaft und Technik kontinuierlich zu beobachten, um auf neue Themen oder Durchbrüche aufmerksam zu werden. Diesem Observatorium liegt die Prämisse zu Grunde, dass die Technologien, die für die Kunden des Fraunhofer INT oder die Gesellschaft in Zukunft von Bedeutung sein werden, heute in den Labors dieser Welt erforscht werden. Somit stellt die Fähigkeit, kontinuierlich einen Überblick über die Geschehnisse im Bereich der Wissenschaften zu generieren, eine wichtige Voraussetzung für die Technologiefrühaufklärung dar.
Da die Kommunikation wissenschaftlicher Erkenntnisse fast ebenso wichtig ist, wie die tägliche Arbeit im Labor, kann man sich über einen Mangel an Informationen nicht beklagen, denn im Schnitt erscheinen etwa 45.000 Publikationen – pro Woche! Davon kann natürlich nur ein winziger Bruchteil von den Mitarbeitern am INT gelesen und analysiert werden. Der Rest ist letztlich eine Art Terra Incognita. Um dieses unentdeckte Land zu erkunden, entwickelt das Fraunhofer INT seit fast 4 Jahren zusammen mit SVA ein innovatives Assistenzsystem für die Technologiefrühaufklärung. Unter dem Projektnamen „Knowledge Analytics for Technology & Innovation“ – abgekürzt KATI – wurde ein browserbasiertes System entwickelt, welches die Wissenschaftler für ihre täglichen Recherchen nutzen können.
Mit diesem Projekt werden mehrere wissenschaftlich herausfordernde Ziele verfolgt. Zunächst soll KATI eine effiziente Rechercheplattform für die Arbeit des Fraunhofer INT sein. Derzeit werden mit dieser die bibliographischen Daten von etwa 60.000.000 wissenschaftlichen Publikationen erschlossen. Nachdem damit zunächst die Grundlagen für das System gelegt wurden soll diese Datenbasis in Zukunft kontinuierlich erweitert werden, um auch Patente und andere Quellen recherchierbar zu machen.
Um den speziellen Anforderungen der Recherche im Rahmen der Technologiefrühaufklärung gerecht zu werden, wurden spezielle Metriken entwickelt und implementiert. Ein Fokus lag hierbei zunächst darauf, Schlüsselpublikationen zu identifizieren, also Publikationen, die besonders gut geeignet sind, um sich in ein Thema einzuarbeiten und aktuelle Entwicklungen zu erkennen. Die hierfür entwickelten Metriken bauen auf der Erfahrung der Mitarbeiter auf und versuchen diese in messbare Größen zu übersetzen. Zusammen mit interaktiven Visualisierungen erlauben es diese dann dem Nutzer, die Rechercheergebnisse aus verschiedenen Blickwinkeln zu betrachten.
Neben der Recherche steht bei KATI die Analyse der Daten im Vordergrund. Dafür wurden diverse, zum Teil am Institut selbst entwickelte Metriken implementiert. Diese Metriken werden mit interaktiven Visualisierungen den Analysten zugänglich gemacht und beleuchten die Wissenschaftslandschaft unter verschiedenen Aspekten und Fragestellungen um daraus wichtige Erkenntnisse über technologische Zukünfte zu generieren. Dazu zählt beispielsweise die Frage, wer in dem betrachteten Thema gerade aktiv forscht. Solche Analysen geben den Wissenschaftlern wichtige Hinweise für die Bewertung eines Themas. Andere wichtige Aspekte, betreffen beispielsweise die Frage, ob sich Forschungsschwerpunkte verschoben haben. Damit ist KATI ein Instrument des Data Driven Foresight. Damit ist ein Foresight-Prozess gemeint, welcher die Analyse großer Datenmengen mit einbezieht.
Das bestehende System hat sich als nützliches und effizientes Tool für die Recherchen und Analysen am Fraunhofer INT erwiesen und wird kontinuierlich weiter entwickelt. Dabei lassen sich drei Entwicklungsstränge unterscheiden. Zunächst geht es darum, die Datenbasis des Systems kontinuierlich zu erweitern, weitere Datenquellen zu erschließen (bspw. Patente oder die Wirtschaftsdaten der Weltbank) und diese auf intelligente Art und Weise miteinander zu verknüpfen. Ferner werden diese Daten mit Hilfe weiterer innovativer Methoden und Visualisierungen analysiert, um ein immer umfassenderes Bild der Wissenschaftslandschaft generieren zu können. Diese Analysen und Metriken sollen schließlich die Basis für Verfahren des maschinellen Lernens bilden, um aus einem analysierenden System schließlich in Zukunft ein lernendes System aufzubauen.