Benötigte Lesezeit: 6 Minuten
Es war ein Algorithmus, der weltweit als erstes die Gefahr einer Pandemie erkannte. Eine Software für Ausbruchs-Risiken registrierte das aufkommende Risiko von COVID-19 in der chinesischen Provinz Hubei am 30. Dezember 2019. Erst drei Monate später, am 11. März 2020, erklärte die Weltgesundheitsorganisation die Ausbreitung des Virus zur Pandemie.
Kamran Khan, der Gründer des verantwortlichen KI Start-Ups BlueDots, lernte durch die SARS-Epidemie 2003, dass Daten dabei helfen können, schneller als das Virus zu sein.
Unzählige Datenwissenschaftler und KI-Experten sammeln heute ähnliche Erfahrungswerte: Viele beteiligten sich in den letzten Monaten an ehrenamtlichen Forschungs-Initiativen. Google listet 11 Millionen Suchergebnisse allein für die Anfrage “COVID-19 Hackathon”. Alle Maßnahmen verfolgten das Ziel, Daten und intelligente Technologien zur Bewältigung der Pandemie einzusetzen.
Doch was hat KI einem Virus entgegenzusetzen?
Um diese Frage zu beantworten, sah ich mir die 26 Präsentationen der diesjährigen, virtuellen Frühlingskonferenz des Stanford Institute for Human-Centered Artificial Intelligence (HAI) an. Experten des Harvard Medical Institutes, der Chan-Zuckerberg-Initiative oder der gemeinnützigen ML-Community Kaggle diskutierten am 1. April 2020 “Wie künstliche Intelligenz genutzt werden kann, um COVID zu bekämpfen”.
Die größte Herausforderung bei der wissenschaftlichen Auseinandersetzung mit COVID kann in einem Wort zusammengefasst werden: Daten. Alle Vortragenden plagten sich mit entweder fehlenden oder zu vielen Informationen über das Virus. Die folgenden Vorträge stehen exemplarisch für sich wiederholende Probleme.
Es sei erwähnt, dass ich den Zugang zur Veranstaltung dem Virus verdanke: Stanford musste die Konferenz wegen der Pandemie digitalisieren und konnte so die Anzahl der Teilnehmer von 800 auf 10.000 erhöhen. Alle Präsentationen sind auch auf YouTube verfügbar.
Daten-Tsunami: Im Zentrum der Aufmerksamkeit
Die Herausforderung: Rund um den Globus versuchen Wissenschaftler bis heute ein Gegenmittel oder eine Impfung zu entwickeln. Die entsprechende Forschung findet in allen Ländern parallel statt. Der Informationsaustausch über neue Resultat eist für den Erfolg vieler Projekte essentiell, aber zugleich eine enorme Herausforderung.
Anthony Goldbloom, Founder and CEO der ML-Community Kaggle, berichtete von einem extrem hohen Volumen an neuen, wissenschaftlichen Texten, die rund um die Welt veröffentlicht wurden. Zahlreiche Forscher widmeten sich verstärkt der Pandemie und publizierten seit Januar 2020 im Schnitt mehr als 1.300 Berichte pro Woche (Quelle: Google Scholar). Für Menschen war diese Menge an Informationen schwer erfassbar.
Die Lösung: Natural Language Processing (NLP) half bei der Bewältigung der Datenflut. Das Kaggle Netzwerk entwickelte beispielsweise einen automatisierten Literatur-Review-Prozess: Neu erschienene Papiere wurden gescannt und zusammengefasst. Ein Mediziner konnte nun eine Frage stellen und das System zeigte alle passenden Antworten schnell und effizient an.
Einen Datenüberfluss beschrieb auch Seema Yasmin, Director of the Stanford Health Communication Initiative, in Bezug auf neue Nachrichten über Covid.
Fazit: KI kann große Datenmengen schneller erfassen und bestimmte Informationen zügig herausfiltern. Davon profitieren zum Beispiel Mediziner oder Forscher rund um den Erdball.
Daten-Ebbe: Verwischte Spuren
Die Herausforderung: John Brownstein, Professor an der Harvard Medical School, betonte wie schwierig es war, ein realistisches Bild der Ausbreitung des Virus zu bekommen, da es einen Mangel an offiziellen Quellen gab. Um z.B. den Ausbruch in China nachzuvollziehen, nutzten er und sein Team Social Media- (WeChat) und Presse-Daten. Doch nicht einmal Data Mining, maschinelles Lernen und Web-Scraping reichten zum Erfassen der benötigten Eckpunkte aus. Eine Armee an Leuten war notwendig, um einen realistischen und vollständigen Überblick zu bekommen.
Die Lösung: Der Experte knüpfte ein Netzwerk aus Universitäten, um gemeinsam Informationen zu sammeln, kuratieren und öffentlich zur Verfügung zu stellen. Er nutzte zudem die Daten intelligenter Produkte: Das digital vernetzte Fieberthermometer Thermia lieferte Input über die Körpertemperatur tausender Nutzer. Der intelligente Chatbot Buoy, angepasst an Covid (1.000 Nutzer pro Tag), erfasste Symptome und konnte dann mit hoher Sicherheit eine Infektion diagnostizieren. Das Tool “Flue near you” – inspiriert vom Spielfilm „Contagion“ – erfasste Symptome von Erkrankten und machte so die Erscheinung und Verbreitung der Erkrankung sichtbar. Doch Brownstein hörte an dieser Stelle nicht auf: Er kombinierte die gewonnenen Daten mit demografischen und regionalen Infos (z.B. Schulschließungen auf kommunaler Ebene). Dadurch konnte er z.B. den Effekt von Social Distancing Maßnahmen besser erfassen.
Ein Mangel an verlässlichen Daten wurde auch von Nigam Shah, Associate Professor of Medicine in Stanford, bei der Kalkulation benötigter Krankenhausbetten beschrieben. Sowie von Lucy Li, Infectious Data Scientist für Chan Zuckerberg Biohub, bei der Berechnung nicht erkannter Infektionen.
Fazit: KI kann dabei helfen, neue Datenquellen zu generieren und existierende Datensätze zu ergänzen. Dadurch kann u.a. der Verlauf der Pandemie erfasst und die Wirkung von Gegenmaßnahmen analysiert werden.
Datenschätze: Bekanntes Wissen neu interpretieren
Die Herausforderung: Stefano Rensi, Research Engineer der Stanford University, wollte herausfinden, ob es existierende Medikamente gibt, die im Kampf gegen COVID eingesetzt werden können.
Die Lösung: Er nutzte bestehende Literatur über zugelassene Medikamente und NLP, um verschiedene Datenpunkte zu kombinieren: Informationen über Proteine, Gene und Chemikalien. Daraus resultierte das Tool “Docs to Graph” welches eine Karte kreierte, die die Beziehungen zwischen den einzelnen Komponenten ermittelte. So war der Experte in der Lage, eine vielversprechende Kombination zu entdecken, die aktuell in Japan an Mäusen getestet wird.
Fei-Fei Li, Denning Family Co-Director am Stanford Institute for Human-Centered Artificial Intelligence, nutzte bestehende Technologien wie z.B. Temperatur- oder Sprachsensoren. Im Rahmen eines Forschungsprojektes wurde so der Gesundheitszustand von Senioren zu überwacht, um knappes Pflegepersonal effektiver einzusetzen.
Fazit: KI kann helfen bestehendes Wissen zu kuratieren und neu zu interpretieren. So können medizinische Lösungen schneller gefunden und angewendet werden.
Aus dem Vorgehen aller Experten lassen sich vier grundlegende Recherche-Fragen ableiten:
- Welche zugänglichen Daten existieren bereits? Gibt es bestehende Fachliteratur, etwa wissenschaftliche Veröffentlichungen oder Informationen über Medikamente?
- Können verschiedene Datenquellen kombiniert werden um neue Datensätze zu kreieren, etwa Social Media und Presseinformationen? Oder regionale Wetterdaten und Fallzahlen?
- Mit welchen anderen Netzwerken oder Gruppen kann man zusammenarbeiten, um schneller mehr zu erreichen oder Daten aus verschiedenen Regionen zu erhalten? Zum Beispiel andere Universitäten, Schulen oder gemeinnützige KI-Communities.
- Welche digitalen oder KI-basierten Werkzeuge oder Produkte sind schon auf dem Markt und können problemspezifische Informationen beisteuern? Im Fall von Covid-19 etwa digitale Fieberthermometer, medizinische Chatbots oder Sprachassistenten.
Länder, denen es gelang die Infektionskurve flach zu halten, hatten eine Sache gemeinsam: zugängliche, saubere und relevante Daten. Taiwan bereitete sich z.B. seit der SARS Epidemie 2003 auf die nächste Welle vor. Neben anderen Maßnahmen, richtete das Land ein Epidemic Command Centre mit einem speziellen Raum für Daten Analysten ein. Jason Wang, Director des Center for Prevention an der Stanford University, beschrieb, dass etwa die Datenbank der nationalen Krankenversicherungen mit der Einreise-Datenbank verbunden wurde. Ärzte konnten so schnell alarmiert werden und reagieren, wenn ein Patient vorab in z.B. Wuhan war.
Die erwähnten Fallbeispiele gewähren nur einen kleinen Einblick in das geballte Wissen, welches in der virtuellen Konferenz geteilt wurde. Bemerkenswert fand ich das spürbare Engagement aller Wissenschaftler, sowie die persönliche Betroffenheit. Die Tatsache, dass COVID einigen befreundeten Forschern das Leben genommen hat, spornte die Gemeinschaft aus Entwicklern und Spezialisten nur noch mehr an.
Letzten Endes können Daten und künstliche Intelligenz ein Virus wie COVID-19 nicht verhindern, aber dessen Siegeszug erschweren oder sogar drastisch verkürzen.
Bild: DALLE 2