Graph-Grammatiken zur Molekularen Substruktursuche

Zurzeit existieren zahlreiche Nomenklaturen, die mittels Zeichenketten molekulare Strukturen beschreiben können. Die derzeit genutzten Nomenklaturen sind die Sybyl Linie-Notation (SLN) oder die SMiles ARbitrary Target Spezifikation (SMARTS). Diese sind in der Regel sehr komplex und erfordern einen hohen Einarbeitungsaufwand, bevor sie routinemäßig eingesetzt werden können. Die vorhandenen Nomenklaturen unterstützen einige, aber nicht alle relevante Anforderungen, wie zum Beispiel, die Abfrage von zwei beliebigen aber identischen Teilstrukturen im Molekül. Erschwerend kommt hinzu, dass das Parsen und Zuordnen von Substrukturen in Molekülen eine sehr komplexe und zeitintensive Abfrage in Datenbanken darstellt. Dieses Suchproblem ist NP-vollständig. Erschwerend komm hinzu, dass es diesen Beschreibungssprachen häufig an formalen Semantikdefinitionen fehlt. Um diese genannten Probleme zu vermeiden, verwenden wir Graph-Grammatiken. Durch den Einsatz von Graph-Grammatiken können Substrukturen direkter und intuitiver beschrieben werden. Graph-Grammatiken in ihrer einfachsten Form ermöglichen eine ähnliche Ausdruckskraft, wie die der SMARTS. Graph-Grammatiken ermöglichen es interessante Unterstrukturen zu definieren, die über die Ausdruckskraft von SMARTS geht. Obwohl die Suche, unter Zuhilfenahme von Graph-Grammatiken, NP-vollständig bleibt, erreichen wir eine identische Ausdruckskraft. Ziel des Projektes ist es einen auf Backtracking basierenden Zuordnungs-Algorithmus zu implementieren. Wir werden früh in der Lage sein, Ergebnisse vom Suchanfragen der Anwender liefern zu können. Durch zeitnahe Rückmeldungen der Anwender zur Güte der Suchergebnisse kann die Allgemeingültigkeit der Transformationsregeln verifiziert werden. Das Herleiten eines effizienten Algorithmus für die interessantesten Formalen Sprachen wird Hauptteil des Projektes darstellen.