Neue Wege der Informationsanalyse
Von Big data zur personalisierten Medizin Das digitale Zeitalter hat auch in der Medizin Fahrt aufgenommen. Die verfügbaren Datenmengen sind schier unerschöpflich. Eine rasante Zunahme an Speicherkapazität (cloud computing), die Fortschritte bei der Datenanalyse (data analytics), der schnelle Datenaustausch und die immer effizienteren Verfahren, große Datenbestände (data mining) auszuwerten, tragen zu dieser Entwicklung bei. „From big data to personalized therapy“ lautete eines der Schwerpunktthemen des 53rd ERA-EDTA-Kongresses im Mai 2016 in Wien. Eine allgemeingültige Definition für „Big Data“ existiert nicht. Versucht man sich an einer Definition, kommt man an den drei V nicht vorbei: Big Data verspricht die Verarbeitung großer Datenvolumen (volume) aus unterschiedlichen Quellen (variety) mit hoher Geschwindigkeit (velocity). Big-Data-Systeme werden eingesetzt, um in großen unstrukturierten Datenbeständen Muster und Abhängigkeiten zu entdecken, um Vorhersagen zu treffen. Vorhersagen, die im klinischen Alltag dazu beitragen, aus den vielen Behandlungsmöglichkeiten für den individuellen Patienten die richtige Wahl zu treffen. Welche Therapie kommt bei Patient A in Frage, welche bei Patient B, und mit welchen Nebenwirkungen ist zu rechnen? Die Spanische Grippe, die zwischen 1918 und 1920 weltweit mehr als 20 Millionen Tote verursachte, wurde durch einen virulenten Abkömmling des Influenzavirus H1N1 ausgelöst. Als sich im Frühjahr 2009 ausgehend von Mexiko in Nordamerika ein zuvor unbekannter Subtyp des H1N1-Virus ausbreitete und bald darauf die ganze Welt erfasst hatte, befürchteten nicht wenige, die neue Pandemie könne im schlimmsten Fall ähnlich fatale Folgen zeitigen. Die zuständige Gesundheitsbehörde CDC (U.S. Centers for Disease Control) führte umgehend eine Meldepflicht ein. Bis die Meldungen jedoch bei der CDC eintrafen und ausgewertet waren, vergingen bis zu zwei Wochen. Bei einer sich schnell ausbreitenden Pandemie können zwei Wochen Ungewissheit zu einer Ewigkeit werden. Nur wenige Wochen bevor der erste Fall von Schweinegrippe in den USA bekannt wurde, hatten Wissenschaftler von Google in Nature einen Algorithmus vorgestellt [1]. Die Softwareentwickler des Internetriesen hatten über einen Zeitraum von fünf Jahren die 50 Millionen am häufigsten von US-Bürgern eingegebenen Suchbegriffe mit realen Krankheitsdaten, wie sie auch von der CDC erhoben werden, verglichen und sie an 450 Millionen unterschiedlichen Rechenmodellen geprüft. Am Ende hatten sie 45 Begriffe, die stark mit dem Auftreten einer Virusgrippe korrelierten. Mit diesen nur 45 Begriffen konnten sie die Ausbreitung einer Grippewelle ebenso gut darstellen wie die CDC, allerdings in Echtzeit. Google Flu Trends benötigte dazu weder Patientendaten, noch prüfte es, ob die 45 Begriffe mit der Influenza in irgendeinem Zusammenhang standen. Bei solch riesigen Datenmengen – die Anzahl der Suchanfragen bei Google lag im Jahr 2012 bei rund 1,2 Billionen – muss man keine Hypothesen aufstellen, um zu Ergebnissen zu kommen. Fairerweise muss man hinzufügen, Google Flu Trends wurde nach fehlerhaften Vorhersagen eingestellt. Der Dienst hatte die tatsächliche Inzidenz der Influenza regelmäßig überschätzt, wie Lazer et al. 2014 in Science berichteten [2]. Die Grundidee, epidemiologische Prognosen und Trendbeobachtungen aus den enormen Datenreservoirs der Suchmaschinen und Social-Media-Anwendungen zu generieren, wird dennoch weiter verfolgt. Die Autoren des Artikels sind sich jedoch sicher: Erst wenn man Data Science mit den konventionellen wissenschaftlichen Methoden verbindet, entsteht eine wirklich bessere Wissenschaft. Rüdiger Zart, Redaktion Referenzen Ginsberg J, Mohebbi MH, Patel RS et al. Detecting influenza epidemics using search engine query data. Nature 2009 Feb 197232): 1012–4. Lazer D, Kennedy R, King G et al. The parable of Google Flu: traps in big data analysis. Science 2014 Mar 14; 343(6176): 1203-5. Nephrologie, Dialyse, Transplantation 53rd ERA EDTA 2016 in Wien 40. Nephrologisches Seminar 2016 in Heidelberg 25. Erfurter Dialysefachtage 2016 Kongressberichte Titelbild Copyright: Thinkstockphotos.in® rvika, Indegene Lifesystems Pvt. Ltd. (Brand Solutions). Gestaltung: Indegene Lifesystems Pvt. Ltd. (Brand Solutions), Keerthi Raja.