Nicht-kodierende Mutationen bei humanen Erkrankungen

Projekt: DFG-ProjekteDFG-Stipendien: Research Fellowships

Projektdaten

Projektbeschreibung

Die Humangenetik erlebt derzeit einen Wandel durch die Einführung von Next-Generation Sequencing (NGS). Erstmals ist es klinisch möglich, ganze Genome zu analysieren. Bisher lag der Fokus auf der Identifikation von Sequenzvarianten im proteinkodierenden Teil des Genoms, dem sog. Exom. Mit dieser Methode kann jedoch bei über 40% der Patienten keine genetische Ursache nachgewiesen werden. Dies könnte daran liegen, dass die nicht-kodierenden DNA bisher ignoriert wurde, obwohl die meisten genetischen Varianten im nicht-kodierenden Genom zu finden sind. Meine eigenen Arbeiten und zahlreiche aktuelle Studien zeigen, dass nicht-kodierende Mutationen eine wichtige Rolle bei angeborenen Fehlbildungen und Tumorerkrankungen spielen und daher bei der medizinischen Interpretation von NGS-Daten berücksichtigt werden sollten. Das Ziel meines Forschungsprojektes ist es daher, die Rolle von nicht-kodierenden Mutationen bei menschlichen Erkrankungen zu untersuchen. Derzeit gibt es mehrere zentrale Probleme bei der Bewertung von nicht-kodierenden Mutationen: 1. Der genetische Code der nicht-kodierenden DNA ist bisher unbekannt. 2. Es gibt derzeit keinen Goldstandard-Datensatz von bekannten nicht-kodierenden Mutationen. 3. Die Anzahl an nicht-kodierenden Varianten ist zu groß, um klassische funktionelle Test durchzuführen. 4. Die topologically associating domain (TAD) Architektur des Genoms spiellt eine zentrale Rolle in der Genregulation. Varianten können TAD-Grenzen verändern, so dass Enhancer auch Gene in benachbarten Domänen miß-regulieren können durch sog. Enhancer-Adoption. Diese Mutationen sind derzeit noch unzureichend untersucht. Um nicht-kodierenden Mutation bei humanen Erkrankungen mit hohem Durchsatz zu untersuchen, schlage ich hier drei experimentelle Strategien vor: Ziel 1: Ich werde 12 cis-regulatorischen Elementen, in denen humane Mutationen bekannt sind, mittels massively parallel reporter assays (MPRA) und Saturation Mutagenese untersuchen. Dies erlaubt die simultane Analyse von mehreren tausenden nicht-kodierenden Mutationen in Zellen. Ich beabsichtige dadurch einen standardisierten Datensatz an nicht-kodierenden Mutationen zu generieren, der als Referenz zur Bewertung von nicht-kodierenden Varianten benutzt werden kann. Ziel 2: Ich plane einen Next Generation Funktionellen Test zu entwickeln, um alle de novo nicht-kodierenden Mutationen von zwei Whole Genome Sequenzierungs-Studien von Patienten mit geistiger Behinderung und Patienten mit Extremitäten Fehlbildungen zu analysieren. Ich werde alle de novo Mutationen mittels MPRA im Vergeleich zum Wildtyp testen.Aim 3: Ich plane mittels CRISPR/Cas9 genome editing 50 TAD-Grenzen zu deletieren, um Enhancer-Adoption als Ursache humaner Erkrankungen zu untersuchen. Meine Ergebnisse werden einen direkten Einfluss auf zukünftige Whole Genome Analysen bei Patienten mit Tumoren und angeborenen Erkrankungen haben.

Ergebnisbericht

NGS technologies enable the simultaneous investigation of the entire genome. However, 40% of patients remain without molecular diagnosis despite that fact that on average ~80 de novo SNVs per patients are identified. The sheer number of these variants, overwhelmingly non-coding, make classical functional workup strategies impractical. In the first part of the project, we performed whole genome sequencing of 50 trios affected with congenital limb malformations, and followed this with functional characterization of all observed non-coding de novo SNVs via massively parallel reporter assays (MPRAs). All patients included were array CGH and exome negative. In total we identified 3,396 de novo mutations in the 50 patients. 5 de novo mutations were located in predicted enhancer regions based on epigenetics marks. For two of these predicted enhancers we could show positive in vivo enhancer activity in transgenic mouse reporter assays. Next, we used microarray-based DNA synthesis to create 230 bp oligonucleotides containing all 3,396 de novo non-coding variants and the corresponding wild-type sequences and perform lentivirus-based MPRAs in human chondrocyte cells and primary mouse limb bud cells. We experimentally measured the cis-regulatory activity of 3,396 de novo non-coding mutations in a single, quantitative experiment. We identified 48 variants that showed significant differential expression of the reporter gene. The positive candidates showed up to 5-fold enrichment for ENCODE TF binding motifs indicating that the mutations are likely to change TF binding and thereby contribute to disease. Our study provides a conceptual framework for the experimental assessment of the large number of de novo non-coding mutations from WGS studies. In the second part of the project, we wanted to study non-coding mutations and structural variants during embryogenesis. As a first step towards understanding pleiotropic developmental disorders at the organismal scale, we created a single cell atlas of the embryonic development of wild-type mice. We studied the transcriptional dynamics of mouse development during organogenesis at single cell resolution. With an improved single cell combinatorial indexing-based protocol ('sci-RNA-seq3'), we profiled over 2 million single cells derived from 61 mouse embryos staged between 9.5 and 13.5 days of gestation (E9.5 to E13.5; 10-15 replicates per time-point) in one, multiplex experiment. We identify major transcriptional lineages as well as hundreds of expanding, contracting and transient cell types, many of which are only detected because of the depth of cellular coverage obtained here. We explore the dynamics of gene expression within cell types over time, and infer pseudo-temporal trajectories of mouse limb and muscle development, including examples of distinct trajectories to the same endpoint. These data comprise a foundational resource for mammalian developmental biology. These data are of enormous interest for human genetics as genotype-phenotype correlations are extremely difficult to understand since the severity of genetic disorders can differ even in individuals with mutations in the same gene.
Statusabgeschlossen
Tatsächlicher Beginn/ -es Ende01.01.1631.12.18

UN-Ziele für nachhaltige Entwicklung

2015 einigten sich UN-Mitgliedstaaten auf 17 globale Ziele für nachhaltige Entwicklung (Sustainable Development Goals, SDGs) zur Beendigung der Armut, zum Schutz des Planeten und zur Förderung des allgemeinen Wohlstands. Die Arbeit dieses Projekts leistet einen Beitrag zu folgendem(n) SDG(s):

  • SDG 3 – Gesundheit und Wohlergehen

Strategische Forschungsbereiche und Zentren

  • Querschnittsbereich: Medizinische Genetik

DFG-Fachsystematik

  • 2.22-03 Humangenetik

Fingerprint

Erkunden Sie die Forschungsthemen zu diesem Projekt. Diese Zuordnungen werden Bewilligungen und Fördermitteln entsprechend generiert. Zusammen bilden sie einen einzigartigen Fingerprint.
  • The single-cell transcriptional landscape of mammalian organogenesis

    Cao, J., Spielmann, M., Qiu, X., Huang, X., Ibrahim, D. M., Hill, A. J., Zhang, F., Mundlos, S., Christiansen, L., Steemers, F. J., Trapnell, C. & Shendure, J., 28.02.2019, in: Nature. 566, 7745, S. 496-502 7 S.

    Publikation: Beiträge in FachzeitschriftenZeitschriftenaufsätzeForschungBegutachtung

    228 Zitate (Scopus)