Feedback

Network-based approaches to understand transcriptional regulation in disease

ORCID
0000-0002-3980-938X
Affiliation/Institute
Peter L. Reichertz Institut für Medizinische Informatik
Galindez, Gihanna Gaye Sta. Teresa

Gene regulatory networks (GRNs) comprise the collection of regulatory relationships between molecular regulators such as transcription factors and their target genes. These networks are important for controlling fundamental biological processes, including development metabolism, and response to environmental stimuli. The inference and analysis of GRNs can benefit both basic biological research and practical applications, including precision medicine and drug repurposing. Given the complexity and context specificity of regulatory relationships across different disease conditions, new computational methods for analyzing high-dimensional omics data are warranted. This thesis presents two new approaches for the inference and analysis of GRNs applied to gene expression data.

Diseases can induce perturbations in normal gene co-expression patterns. Thus, detecting differentially co-expressed or rewired edges between disease and healthy biological states can be useful for investigating the link between specific molecular alterations and disease phenotypes. The first study presents BoostDiff (Boosted Differential trees), a tree-based ensemble algorithm for inferring differential GRNs from two conditions. BoostDiff modifies standard regression trees by building an adaptively boosted (AdaBoost) ensemble of differential trees with respect to a target condition. Each differential tree serves as the base learner and is built using a new splitting criterion called differential variance improvement. The performance of BoostDiff is demonstrated using both simulated and real-world transcriptomics datasets. BoostDiff identifies context-specific networks that are enriched with genes of known disease-relevant pathways and can complement standard differential expression analyses.

The second study explores the utility of combining active module identification on protein-protein interaction networks and the prize-collecting Steiner tree algorithm on GRNs. The proposed workflow, named Transcriptional Regulator Identification using Prize-collecting Steiner trees (TRIPS), is designed to identify candidate regulators influencing disease using results from differential expression analysis and prior knowledge from biomedical databases. Systematic analyses using multiple disease-associated datasets demonstrate that TRIPS can recover relevant regulators with high precision. Furthermore, our findings reinforce the importance of performing network perturbation analyses to characterize the reliability of network-based tools. In particular, the prize-collecting Steiner tree approach implemented in TRIPS was found to better utilize the knowledge encoded in the structures of molecular networks. TRIPS can be used as a post-processing step in analyzing gene expression data to provide network-based context for prioritizing transcriptional regulators in downstream experiments.

Collectively, these two studies expand the computational toolbox for deriving biologically meaningful insights from omics data and can find practical application in the field of systems medicine.

Genregulatorische Netzwerke (GRN) umfassen die Gesamtheit der regulatorischen Beziehungen zwischen molekularen Regulatoren wie Transkriptionsfaktoren und ihren Zielgenen. Diese Netze sind wichtig für die Steuerung grundlegender biologischer Prozesse, einschließlich Entwicklung, Stoffwechsel und Reaktion auf Umweltreize. Die Inferenz und Analyse von GRN kann sowohl der biologischen Grundlagenforschung als auch der praktischen Anwendungen wie der Präzisionsmedizin und dem Drug-Repurposing, also der Verwendung bekannter Wirkstoffe für neue Indikationen, zugutekommen. Angesichts der Komplexität und Kontextspezifität der regulatorischen Beziehungen in verschiedenen Krankheitszuständen sind neue computergestützte Methoden zur Analyse hochdimensionaler Omics-Daten erforderlich. In dieser Arbeit werden zwei neue Ansätze für die Inferenz und Analyse von GRN vorgestellt, die auf Genexpressionsdaten basieren.

Krankheiten können Störungen in normalen Koexpressionsmustern von Genen hervorrufen. Daher kann die Erkennung von differentiell ko-exprimierten Genen, oder die Änderung regulatorischer Beziehungen an sich zwischen kranken und gesunden biologischen Zuständen nützlich sein, um die Rolle spezifischer molekularer Veränderungen für Krankheitsphänotypen zu untersuchen. In der ersten Studie wird BoostDiff (Boosted Differential trees) vorgestellt, ein nicht-parametrischer baumbasierter Algorithmus zur Ableitung differentieller GRN aus zwei Zuständen. BoostDiff modifiziert Standard-Regressionsbäume, indem es ein adaptiv geboostetes (AdaBoost) Ensemble von differentiellen Bäumen in Bezug auf eine Zielbedingung (z.B. krank vs. gesund) erstellt. Jeder differentielle Baum dient als Basis-Lerner und wird unter Verwendung eines neuen Spaltungskriteriums namens differentielle Varianzverbesserung erstellt. Die Leistung von BoostDiff wird anhand von simulierten und realen Transkriptomik-Datensätzen demonstriert. BoostDiff identifiziert kontextspezifische Netzwerke, die mit Genen bekannter krankheitsrelevanter Pfade angereichert sind und bringt somit einen deutlichen Mehrwert gegenüber differentiellen Expressionsanalysen.

In der zweiten Studie wird der Nutzen einer Kombination aus der Identifizierung sog. aktiver Module in Protein-Protein-Interaktionsnetzwerken und dem Price-Collecting-Steiner-Tree-Algorithmus in GRN untersucht. Der vorgeschlagene Arbeitsablauf mit dem Namen „Transcriptional Regulator Identification using Prize-collecting Steiner trees“ (TRIPS) wurde entwickelt, um Regulatoren zu identifizieren die potentiell Krankheiten beeinflussen, indem Ergebnisse aus differentiellen Expressionsanalysen und Vorwissen aus biomedizinischen Datenbanken verwendet werden. Systematische Analysen mit mehreren krankheits-spezifischen Datensätzen zeigen, dass TRIPS relevante Regulatoren mit hoher Präzision ermitteln kann. Darüber hinaus unterstreichen unsere Ergebnisse die Bedeutung der Durchführung von Netzwerk-Permutationsanalysen, um die Zuverlässigkeit netzwerkbasierter Werkzeuge bewerten zu können. Insbesondere hat sich herausgestellt, dass der in TRIPS implementierte Steiner-Baum-Ansatz das in den Strukturen der molekularen Netzwerke kodierte Wissen besser nutzt als bisherige Verfahren. TRIPS kann als Nachbearbeitungsschritt bei der Analyse von Genexpressionsdaten verwendet werden, um netzwerkbasierten Kontext für die Priorisierung von Transkriptionsregulatoren in nachgelagerten Experimenten zu liefern.

In Kombination erweitern diese beiden Studien das bioinformatische Instrumentarium zur Gewinnung biologisch aussagekräftiger Erkenntnisse aus Omics-Daten. Sie können im Bereich der Systemmedizin praktische Anwendung finden.

Cite

Citation style:
Could not load citation form.

Access Statistic

Total:
Downloads:
Abtractviews:
Last 12 Month:
Downloads:
Abtractviews:

Rights

Use and reproduction: