Krankmachende Gene in Virenstämmen in Minutenschnelle erkennen

By Petra Wiesmayer

Das die Medien momentan alles beherrschende Thema ist die rapide Verbreitung des Coronavirus. Seit Bekanntwerden der ersten Fälle in China Ende Dezember 2019 in der Millionenstadt Wuhan gibt es mittlerweile beinahe stündlich neue Meldungen über Erkrankungen auf der ganzen Welt. Die Forschung nach einem wirksamen Mittel gegen die Krankheit läuft zwar auf Hochtouren, von einem Heilmittel oder gar einem Impfstoff ist man aber noch immer weit entfernt. Gegenüber herkömmlichen Medikamenten ist das neue Virus resistent. Die Frage ist warum.

Nach der SARS-Pandemie 2002/2003 und den immer neuen Influenza-Viren, die im Winter 2017/2018 alleine in Deutschland mehr als 25.000 Menschen das Leben kosteten, zeigt sich nun am Beispiel Coronavirus wieder, wie wichtig es wäre, die jeweiligen Besonderheiten neuer Viren- und Bakterienstämme schnellstens zu ermitteln.

Das neue, internationale Projekt „Pangaia“ (Pan-genome Graph Algorithms and Data Integration) mit Beteiligung der Universität Bielefeld soll dank neuer Big-Data-Technologie genau dabei helfen. Die Wissenschaftler vergleichen dafür das Erbgut eines einzelnen Organismus mit dem Genom-Bestand aller Stämme einer Spezies und erforschen, wie sich die dabei verwendeten Datenmassen so ordnen und analysieren lassen, dass sie für die Biomedizin nutzbar sind.

Vergleiche mit Referenzgenomen

Die Bestimmung, ob das Erbgut besondere Abweichungen aufweist, geschieht anhand eines Referenzgenoms, in dem mehrere Genome so kombiniert werden, dass sie die typischen Eigenschaften einer ganzen Spezies aufweisen. Bei Grippeviren heißt das, dass das Virus mit einem Referenzgenom verglichen wird, das sämtliche typischen Merkmale der bis dahin bekannten Virenstämme in sich vereint.

Spezielle Graphen stellen Verbindungen zwischen Genomen als Knotenpunkte dar. Weichen einzelne Gene eines einzelnen Organismus stark von den typischen Genen seiner Spezies ab, werden sie als auffällige Kurven und Linien dargestellt. Das ist zum Beispiel der Fall bei Genen, die Erbkrankheiten auslösen. Bild: Universität Bielefeld/R. Wittler

„In diesen Fällen vergleichen wir nur zwei Genome miteinander – Unterschiede und Gemeinsamkeiten sind am Computer relativ leicht zu erkennen“, sagt Professor Dr. Jens Stoye von der Technischen Fakultät Universität Bielefeld. Er ist mit seiner Arbeitsgruppe Genominformatik an Pangaia beteiligt. „Der neue Ansatz kann die Zahl der Vergleichsgenome bis zum Tausendfachen vergrößern.“ Diese Erforschung des Gen- Repertoires einer Population nennen die Forschenden „Pangenomik“. „Das Problem an der computergestützten Pangenomik war bisher die Unübersichtlichkeit durch die Masse an Daten“, erklärt Professor Dr. Alexander Schönhuth, der das Bielefelder Teilprojekt von Pangaia koordiniert.

Die Nukleotide, die Bausteine des Erbguts, werden mit den Buchstaben A, C, G und T dargestellt. Da Genome aber mitunter aus Milliarden dieser Informationseinheiten bestehen, werden sie traditionell als „Buchstaben-Ketten“ nebeneinander angezeigt, um sie besser miteinander vergleichen zu können. „Doch bei Hunderten von Vergleichsgenomen kostet es sehr viel Zeit, schrittweise zu analysieren, wie sich das zu untersuchende Genom von jedem der Vergleichsgenome unterscheidet“, sagt Schönhuth.

Gleichzeitiger Vergleich vieler Stämme desselben Organismus

Die neue Technologie mache es nun möglich, viele Stämme desselben Organismus gleichzeitig zu analysieren, egal ob Viren, Bakterien er sogar höhere Lebewesen, erklärt Jens Stoye. So ließen sich Gemeinsamkeiten und Unterschiede der einzelnen Mitglieder hervorheben. Bei Krankheitserregern ließen sich häufig sogar die Abläufe, die zur Entstehung besonders infektiöser Stämme geführt haben, verstehen und vorhersagen.

Um die computergestützte Pangenomik schneller und anwendungsfreundlicher zu machen, wollen die Forscher in den nächsten Jahren neue Algorithmen und Datenstrukturen entwickeln, um unter anderem Algorithmen für Variationsgraphen auszuarbeiten. Mit diesen Variationsgraphen suchen die Computer nach Gemeinsamkeiten und Unterschieden zwischen den Vergleichsgenomen. Das Ergebnis wird dann grafisch dargestellt: „Variationsgraphen erlauben die schnelle und hochaufgelöste Unterscheidung von krankheitserregenden und ungefährlichen Varianten eines Virus“, sagt Schönhuth. „Insbesondere erlauben sie auch die Identifikation von ganz neuartigen Mutationen, wie sie vermutlich bei der aktuell in China ausgebrochenen Variante des Coronavirus aufgetreten sind und zu Resistenzen gegen die üblichen Medikationen geführt haben.“

Laut Aussagen der Wissenschaftler kann dieses neue Verfahren auch für höher entwickelte Lebewesen wie Säugetiere genutzt werden oder, um Erbkrankheiten bei Menschen zu erkennen. Darüber hinaus kann es auch helfen zu ermitteln, welche Mutationen in einem Tumor zum starken, krankhaften Wachstum geführt haben.

Das Projekt läuft von Januar 2020 bis Dezember 2023 und wird von der Europäischen Union über ihr Forschungsrahmenprogramm Horizont 2020 mit 1,14 Millionen Euro gefördert. Die Universität Bielefeld ist eine von elf Projektpartnern aus Europa und Nordamerika. Die Universität Mailand (Italien) koordiniert das Projekt, weitere Partner sind die niederländische Wissenschaftsorganisation NWO, die Comenius-Universität Bratislava (Slowakei), die Biotech-Unternehmen Geneton (Slowakei) und Illumina Cambridge (Großbritannien), das Institut Pasteur (Frankreich), die Simon Fraser University (Kanada), die Universität Tokio (Japan), die Cornell University und die Pennsylvania State University (beide USA).