Bayes'sche Parameteridentifikation und Unsicherheitsquantifizierung in der Systembiologie: Eine Studie anhand des Drosophila Gap Gene System

Systembiologie ist eine wachsende Disziplin, welche experimentelle Techniken mit Methoden der rechnergestützten Forschung kombiniert. Die mathematische Modellierung genregulatorischer Netzwerke stellt hier eine besondere Herausforderung dar, weil die zugrundeliegende Biologie oft nur unvollständig verstanden ist, so dass in Modellen eine grosse Zahl potentiell irrelevanter regulatorischer Verknüpfungen vorliegt. Eine wichtige daraus resultierende Aufgabenstellung ist die Reduktion genregulatorischer Netzwerkstrukturen basierend auf experimentellen Daten, das sogenannte Reverse Engineering. Derartige inverse Probleme sind typischerweise schlecht konditioniert (diskret schlecht-gestellt) weil die Lösung (im kleinste-Quadrate Sinn) extrem sensitiv von den Messdaten abhängt. Dadurch führen kleine Datenfehler zu einer starken Fehlerpropagation von den Daten zur Lösung und folglich wenig aussagekräftigen Parameterschätzwerten. Diese Schlechtgestelltheit nimmt mit der Zahl der unbekannten Parameter zu, so dass die Verwendung von Regularisierungsverfahren erforderlich wird. Das Langzeitziel dieses Projekts ist die Entwicklung eines allgemeinen Frameworks für ODE-basierte Modelle, welches eine solche Regularisierungsstrategie liefert zur stabilen Bestimmung unbekannter Modellparameter sowie einer minimalen, mit den Messdaten verträglichen, Netzwerktopologie. Zugleich sollte die Methode die Unsicherheit der geschätzten Modellparameter quantifizieren. Dieser Aspekt wurde, möglicherweise aufgrund des enormen Rechenaufwandes, bisher nicht hinreichend in der biologischen Literatur behandelt. Mit dieser Studie möchten wir eine effiziente parallele Implementierung einer neuartigen Regularisierungsstrategie, sowie deren mathematische Rechtfertigung liefern. In diesem Projekt soll eine neuartige Bayes'sche Regularisierungsstrategie weiterentwickelt werden, die eine sparsity-befördernde Regularisierung mit Unsicherheitsquantifizierung kombiniert. Diese Strategie wurde am Institut für Mathematik entwickelt und anhand eines Parameteridentifikationsproblems für das Drosophila Gap Gene System getestet. Dieses biologische System wurde detailliert durch quantitative experimentelle Messungen charakterisiert und gilt als ein wichtiges Benchmarkproblem in der Systembiologie. Biologische Expertise ist für das Gelingen des Projekts von fundamentaler Bedeutung, weshalb es in enger Zusammenarbeit mit der Gruppe von Dr. S. Legewie am Institut für Molekulare Biologie durchgeführt werden soll. In dieser Gruppe besteht, unabhängig vom Drosophila Benchmarkproblem, starkes Interesse an der Verwendung der zugrundeliegenden Methodik im Kontext von Reverse Engineering in der Systembiologie, z.B. für genregulatorische Netzwerke, die Zellmigration kontrollieren und für Signalpfade, die bei Darmkrebs dereguliert sind. Bedingt durch den enormen Rechenaufwand einer großskaligen Studie wird der primäre Fokus während der Förderperiode zunächst auf der Entwicklung einer parallelen Implementation und einer sorgfältigen Evaluation gegen etablierte Ansätze für das Drosophila Gap Gene System liegen.