Entwurf, Implementierung und Evaluierung einer hoch sensitiven CUDA-basierten Methode für das Alignment von Hoch-Durchsatz DNA-Fragmenten auf Referenzgenome

Hoch-Durchsatz DNA Sequenzierungstechnologien (wie z.B. Illumina Sequenzierer) produzieren kurze DNA-Fragmente mit geringen Kosten. Das enorme Wachstum der produzierten Datensätze ist eine Herausforderung für das effiziente und genaue Abbilden ("Alignment") der kurzen Fragmente auf Referenzgenome, wie z.B. das menschliche Genom. Bisherige Methoden benutzen häufig ein restriktives Fehlermodel für die Berechnung der Alignments, um Laufzeit zu verbessern. Flexiblere Fehlermodelle sind in der Regel zu langsam für große Datenmengen. Des Weiteren werden viele Alignment-Methoden ineffizient für wachsende Fragment-Längen. Das Ziel dieses Projektes ist deshalb Entwurf, Implementierung und Evaluierung einer neuen Methode mit i. hoher Sensitivität ii. hohem Durchsatz iii. hoher Effizienz für wachsende Fragment-Langen und wachsenden Fehlerraten Unser Ansatz, um diese Ziele zu erreichen, basiert auf flexiblen Datenstrukturen und Algorithmen, die eine hohe Effizienz auf massiv parallelen GPUs mit dem CUDA Programmiermodell aufweisen.

Diese Projekt wird durchgeführt in Kollaboration mit Dr. John Castle (TrOn - Translationale Onkologie gGmbH Mainz)