Mehr als andere Faktoren zählt bei einer Krebserkrankung der Faktor Zeit – für Untersuchungen, Forschungsergebnisse und Antworten auf Fragen, die für den Erkrankten oft über Sieg oder Niederlage im Kampf gegen den Krebs entscheiden. Um das Turmorgut von Patienten zu untersuchen, setzt das Deutsche Krebsforschungszentrum in Heidelberg (DKFZ) Fujitsus Integrated System PRIMEFLEX for Hadoop ein. Auf dem „bitkom Big Data Summit“ erläuterten Dr. Fritz Schinkel (Fujitsu) und Dr. Matthias Schlesner (Deutsches Krebsforschungszentrum) die wichtigsten Faktoren einer „schnellen Orientierung in Genomdaten“.
Verglichen mit Big Data wirkt das menschliche Genom mit „nur“ 3 Milliarden Basen-Paaren eher klein. Jedoch kommen auf einen Krebspatienten mehrere Gewebeproben und die so genannten „Oversampling-Faktoren“ sorgen zusätzlich dafür, das pro Patient bis zu einem halben Terabyte Daten anfallen. Bei einer größeren Gruppe an Patienten, zum Beispiel wie hier für Studienzwecke, können somit mehrere Petabyte an Daten zusammenkommen. Mit speziellen Verfahren und in kleinen Schritten entlocken die Wissenschaftler diesen Daten die notwendigen Informationen. Bis ein Resultat vorliegt, vergehen so oft mehrere Monate. Um diesen Vorgang zu beschleunigen und damit Leben zu retten, bereitet das DKFZ Rohdaten für eine schnelle, parallele Bearbeitung auf und an dieser Stelle kommt PRIMEFLEX for Hadoop zum Einsatz.
Hinter dem Faktor Zeit steht die Hoffnung
PRIMEFLEX for Hadoop kombiniert die Vorteile vorkonfigurierter und vorab getesteter Hardware, die auf Industrie-Standard-Komponenten basiert, mit Open-Source-Software von Cloudera® und der Big-Data-Analysesoftware von Datameer®. Für das DKFZ bedeutet diese Lösung eine schlüsselfertige und leistungsstarke Big-Data Plattform und für die Patienten steht hinter dem Faktor Zeit besonders eins – Hoffnung. Dr. Matthias Schlesner, Head of Computational Oncology, DKFZ:
Die Analyse großskaliger biomedizinischer Datensätze in der Krebsforschung und bei der Untersuchung genetischer Erkrankungen setzt voraus, dass Rohdaten besser für eine schnelle und parallele Verarbeitung organisiert werden. Das lässt sich mithilfe von Big-Data-Infrastrukturen und einer entsprechenden Analysesoftware bewerkstelligen. Dadurch erhalten unsere Forscher deutlich schneller Antworten auf ihre Fragen. Das wiederum kommt dem Patienten zugute.
Eine Vision, die den Kern der Sache trifft
Je schneller die Forscher des DKFZ auf ihre Fragen eine Antwort finden, desto mehr dürfen Krebspatienten auf eine Chance hoffen. Bereits in unserer Vision, der „Human Centric Innovation“, haben wir die Grundsätze dieser Zusammenarbeit fest verankert: Wir glauben, dass wahre Innovation durch die Zusammenarbeit von Menschen entsteht, die Lösungen für Menschen schaffen. Im Fall des Deutschen Krebsforschungszentrums tragen wir mit unserer Technologie dazu bei, Menschen zu helfen und vertreten unsere Vision einmal mehr. Dr. Fritz Schinkel, Head of Competence Center Big Data, Fujitsu:
Nicht nur Unternehmen, sondern auch Forschungseinrichtungen wie das Deutsche Krebsforschungszentrum profitieren von Big-Data-Technologien. Doch dazu benötigen sie eine Hochleistungsplattform, die sich auf einfache Weise implementieren und bei Bedarf schnell erweitern lässt. Mit Integrated System PRIMEFLEX for Hadoop steht eine Lösung zur Verfügung, die exakt diese Anforderungen erfüllt. Damit leistet Fujitsu einen maßgeblichen Beitrag zu einer „Human Centric Intelligent Society“.
Den gesamten Vortrag der Referenten können Sie sich auf Slideshare ansehen. Wir ziehen aus dem „bitkom Big Data Summit“ ein rundum positives Fazit. Vom erklärten Ziel des DKFZ – ein Leben ohne Krebs – mögen wir zwar noch weit entfernt sein, aber mit jedem Schritt auf diesem langen Weg kommen diesem Ziel vielleicht ein Stückchen näher.