Inferring organismal and character evolution from functional genome features
The development of phylogenomics pipelines is important as phylogeny-driven genome sequencing projects generate plenty of genomic data. This thesis work focused on the development of three pipelines which yield: 1. proper taxonomic descriptions of new genomes; 2. phylogeny using genome encoded functionalities and COGs; and 3. evolutionary correlations between functional characters (e.g., genes), genome features of newly sequenced genomes and their functional linkages. 34 variations of distance-based phylogenetic tree reconstruction strategies for eight datasets were formulated with regard to different sources, threshold applied weights and distance calculation methods. The specific strategic variations which are similar to previously described approaches were statistically tested. A contemporary way of inferring phylogenies using conserved genome features in whole genome level was optimized and reported. A strategy was developed to calculate the evolutionary correlation in different genomic features and their functional linkages. BayesTraits software was used in the pipeline to estimate the correlated evolution between character pairs. Characters were clustered using the MCL algorithm with regard to significant evolutionary correlations between characters. The pipelines were standardized using eight datasets. E. coli + Shigella, Spirochaetae and Rhodobacteraceae datasets were applied on this pipeline for finding evolutionary correlation between functional characters. The correlated genes in motility pathways were identified and interpreted with previous scientific evidences for the Spirochaetae dataset. The distribution of correlated enzymes per pathway in Rhodobacteraceae dataset were identified. The evolutionary correlation of cp4-44 prophage element with pathogenicity in E. coli + Shigella were identified and interpreted along with the character state reconstructions of both characters. The evolutionary correlation of four pathways and one enzyme with marine/non-marine living characteristics of Rhodobacteraceae dataset were identified and interpreted along with character state reconstruction which describes patterns of evolutionary events for different genomic features on the phylogeny.
Die Entwicklung phylogenetischer Pipelines ist wichtig, da Phylogenie-getriebene Sequenzierungsprojekte viele genomische Daten generieren. Diese Arbeit konzentriert sich auf die Entwicklung von drei Piplelines, die folgendes leisten: 1. korrekte taxonomische Beschreibungen von neuen Genomen, 2. im Genom kodierten Funktionalitäten und COGs und 3. evolutionäre Korrelationen zwischen funktionalen Einheiten (z.B. Genen) und ihre funktionalen Verbindungen. 34 Variationen von Distanz-basierten Rekonstruktionsstrategien für phylogenetische Bäume wurden für acht Datensätze wurden hinsichtlich verschiedener Quellen, aufgebracht Schwellengewichte und Abstandsberechnungsmethoden formuliert. Die einzelnen Variationen der Strategien, die ähnlich zu bereits beschriebenen Ansätzen sind, wurden statistisch überprüft und diskutiert. Eine zeitgemäße Art und Weise der Ableitung Phylogenien mit konservierten Genomischen Features in Gesamtgenomlevel optimiert und gemeldet. Es wurde eine Strategie entwickelt, um die evolutionäre Beziehung in verscheidene Genomischen Features und ihrer funktionellen Verknüpfungen zu berechnen. Die BayesTraits Software wurde in der Pipeline genutzt um den Grad der korrelierten Evolution zwischen Einheiten paaren zu schätzen. Die Einheiten wurden mit dem MCL Algorithmus geclustert. Dabei lag das Hauptaugenmerk auf den signifikanten evolutionären Korrelationen zwischen den Einheiten. Die Einheiten wurden mit acht Datensätzen standardisiert. E. coli + Shigella, Spirochaetae und Rhodobacteraceae Datensätze wurden durch die Pipeline prozessiert um evolutionäre Korrelationen zwischen den funktionalen Einheiten zu finden. Die korrelierten Gene in Soffwechselwegen, die mit Mobilität assoziiert sind, wurden für den Spirochaetae Datensatz mit früheren wissenschaftlichen Beweise interpretiert. Die Verteilung von korrelierten Enzymen je Stoffwechselweg im Rhodobacteraceae Datensatz identifiziert wurden. Die evolutionäre Korrelation von cp4-44 Prophage Element mit der Pathogenität in E. coli + Shigella wurden identifiziert und zusammen mit den staatlichen Charakter Rekonstruktionen der beiden Zeichen interpretiert. Die evolutionäre Korrelation von vier Pathway und ein Enzym mit Meeres/nicht-Meeres lebenden Eigenschaften von Rhodobacteraceae Datensatzes identifiziert und zusammen mit Charakter Zustandsrekonstruktion. Es beschreibt verschiedene Muster evolutionärer Ereignisse der Genomischen Features auf die Phylogenie.
Preview
Cite
Access Statistic

Rights
Use and reproduction:
All rights reserved