Statistical analysis of the X chromosome in genetic association studies

Project: DFG Individual Projects

Project Details

Description

When investigating the genetic basis of complex diseases in genome-wide association studies, analysis of the X chromosome has so far largely been omitted, despite its importance as a genetic marker. The core problem is that women carry two X chromosomes, while men carry one, so that information from women and men must be considered differently when a mixed sample is available. The optimal statistical approach for this is unclear. To date, two studies have proposed tests for the X chromosome (Zheng et al. Genetic Epidemiology. 2007;31:834-43; Clayton. Biostatistics. 2008;9:593-600). The difference between the two approaches is that for the purposes of Zheng et al.'s statistics, men with a risk allele are counted like heterozygous women. Clayton's statistics, however, take into account that in women, one of the two X chromosomes is inactivated, so that men with one risk allele are counted as women with two. The goal of this project is to compare the proposed tests in simulation studies, develop further test alternatives, and apply the various tests to real data from existing genome-wide association studies.

Key findings

Es hat sich gezeigt, dass in der Mehrheit der genomweiten Assoziationsstudien bislang X-chromosomale Varianten von der Analyse ausgeschlossen wurden, obwohl es bei vielen komplexen Erkrankungen plausibel ist, dass auch diese Varianten eine Rolle spielen. Wichtige Gründe für diese Situation bestehen darin, dass weder für die statistische Auswertung noch für die Vorverarbeitung und Qualitätssicherung X-chromosomaler Varianten Standardverfahren existieren. Das übergeordnete Ziel dieses Projekts bestand entsprechend darin, vorgeschlagene statistische Tests auf Assoziation mit X-chromosomalen Varianten miteinander zu vergleichen und weiterzuentwickeln. Diese Tests sollten auf bestehende Datensätze aus genomweiten Assoziationsstudien angewendet und anhand von Skripten allgemein verfügbar gemacht werden. Für das erste Ziel, den Vergleich existierender Tests, wurde eine umfassende Simulationsstudie durchgeführt und veröffentlicht. Hierbei wurden verschiedene relevante Szenarien berücksichtigt, und es konnte gezeigt werden, dass es kein Verfahren gibt, das regelmäßig beste Ergebnisse liefert. Entsprechend wäre ein Verfahren sinnvoll, dass verschiedene Tests miteinander kombiniert, so dass wir zur Erweiterung bestehender Tests (Ziel 2) auf die Konstruktion eines geeigneten MAX-Tests für das X-Chromosom fokussiert haben. Hierzu wurde ein sehr flexibel einsetzbares MAX-Testverfahren für das Autosom entwickelt und publiziert, welches nun auf das X-Chromosom erweitert wird. Verschiedene Testverfahren zur Assoziation mit X-chromosomalen Varianten wurden auf eine Reihe existierender Datensätze angewendet (Ziel 4). Während die Analysen zu den Phänotypen schwere Malaria und primär sklerosierende Cholangitis keine Hinweise auf einen signifikanten X-chromosomalen Effekt ergaben, zeigten die Auswertungen zu Morbus Crohn und die vorläufige Metaanalyse zu koronarer Herzerkrankung signifikante Ergebnisse, deren Funktion noch weiter zu klären ist. Insbesondere die Metaanalyse gestaltete sich als deutlich zeitaufwändiger als geplant, da vor allem die Schritte der Vorverarbeitung und Qualitätssicherung auf dem X-Chromosom zunächst nicht etabliert waren. Im Ziel 3 schließlich war vorgesehen, die Teststatistiken in einem R-Paket zur Verfügung zu stellen. Aufgrund der praktischen Probleme, die sich in der Erreichung des vierten Ziels ergaben, verschob sich der Fokus auf die Bereitstellung konkreter Auswertungsskripte an Kooperationspartner sowie auf die Publikation allgemeiner Vorgehensempfehlungen bei der Berücksichtigung des X-Chromosoms in genomweiten Assoziationsstudien.

Statusfinished
Effective start/end date01.01.1031.12.16

UN Sustainable Development Goals

In 2015, UN member states agreed to 17 global Sustainable Development Goals (SDGs) to end poverty, protect the planet and ensure prosperity for all. This project contributes towards the following SDG(s):

  • SDG 3 - Good Health and Well-being

Research Areas and Centers

  • Research Area: Medical Genetics

DFG Research Classification Scheme

  • 2.22-01 Epidemiology, Medical Biometry/Statistics
  • 2.22-03 Human Genetics

Funding Institution

  • DFG: German Research Association

ASJC Subject Areas

  • Epidemiology
  • Genetics

Fingerprint

Explore the research topics touched on by this project. These labels are generated based on the underlying awards/grants. Together they form a unique fingerprint.