• Medientyp: Elektronische Hochschulschrift; Dissertation; E-Book
  • Titel: Efficient Sparse-Group Bayesian Feature Selection for Gene Network Reconstruction ; Gennetzwerkrekonstruktion mit effizienter Bayes'scher Selektion von gruppierten Variablen
  • Beteiligte: Steiger, Edgar [VerfasserIn]
  • Erschienen: Freie Universität Berlin: Refubium (FU Berlin), 2018
  • Umfang: xi, 115 Seiten
  • Sprache: Deutsch; Englisch
  • DOI: https://doi.org/10.17169/refubium-555
  • Schlagwörter: expectation propagation ; Netzwerkrekonstruktion ; networks ; Variablenselektion ; Bayes ; gene network reconstruction ; spike-and-slab ; feature selection ; Statistik ; statistics
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: Die Gesamtheit der Gene eines Organismus ist verwoben in einem ausgeklügelten Netzwerk von Interaktionen. Viele dieser Interaktionen sind unbekannt, aber das Wissen um die genaue Gennetzwerkstruktur ist unter anderem wichtig für medizinische Anwendungen. Das unterstreicht die Dringlichkeit, aus experimentellen Genexpressionsdaten das zugrundeliegende Gennetzwerk zu rekonstruieren, auch für sehr große Netzwerke mit vielen Genen. Gennetzwerkrekonstruktion kann als ein Problem von Variablenselektion in linearer Regression aufgefasst werden. Wir nehmen als zusätzliche Information über das Netzwerk (wie z.B. das gemeinsame Binden von Transkriptionsfaktoren) eine Gruppierung der Variablen hinzu. Die bisher verfügbaren Methoden für Variablenselektion mit Gruppierung haben verschiedene Nachteile: "Lasso" und seine Abwandlungen setzen die Regressionskoeffizienten zu gering an und nutzen die Gruppierungsinformation nicht voll aus, Bayes'sche Ansätze benutzen meist das langsame Gibbs-Sampling, um Parameter zu bestimmen, dies verhindert ihren Einsatz für die Gennetzwerkrekonstruktion. Wir präsentieren hier eine Bayes'sche Methode für Variablenselektion mit Gruppierungsinformation, die Spärlichkeit in den Koeffizienten zwischen und innerhalb von Gruppen durchsetzt, und außerdem die Parameter mit einem deterministischen und schnellen Algorithmus bestimmt ("Expectation Propagation"). Wir wenden unsere neue Methode für die Gennetzwerkrekonstruktion an und erweitern sie auch auf das vektorautoregressive Modell für Zeitreihendaten. Wir zeigen auf simulierten und experimentellen Daten, dass aus drei Gründen der Bayes'sche Ansatz die beste Wahl für Netzwerkrekonstruktion ist: die höchste Zahl an korrekt identifizierten Variablen, beste Voraussagekraft auf neuen Daten und eine angemessene Rechendauer. Weiterhin zeigen wir, dass auch auf Zeitreihendaten der Bayes'sche Ansatz den Lasso-Methoden überlegen ist, wobei die Resultate mit einem linearen Modell auf experimentellen Zeitreihendaten generell weniger belastbar sind. Darüber ...
  • Zugangsstatus: Freier Zugang