Nicht zufällige Verteilung von Transkriptionsfaktor : Bindungsstellen im Arabidopsis thaliana Genom
Das Genom der kleinen Pflanze Arabidopsis thaliana ist komplett durchsequenziert und annotiert, wodurch es für die Bioinformatik gut geeignet ist. In der hier vorliegenden Arbeit wurden Verteilungsanalysen von Transkriptionsfaktor-Bindungsstellen (TFBSn) durchgeführt. Da die genomische Verteilung von TFBSn mit dem AT/GC Gehalt zusammenhängen kann, wurde zunächst der AT Gehalt der Regionen innerhalb von Genen, wie UTRs, Introns, Exons, sowie des intergenischen Bereichs untersucht. Es konnte gezeigt werden, dass der Beginn und das Ende der UTRs, Introns und Exons bevorzugte Nukleotidkompositionen aufweisen. In einem weiteren Schritt fand eine genomweite Suche nach TFBSn für verschiedene Transkriptionsfaktoren (TFen) statt. Die Suche basierte auf Matrizen, die z.B. aus der Literatur extrahiert wurden. Danach wurden Verteilungsanalysen der TFBSn relativ zum Translationsstartpunkt und zu den oben genannten Genregionen durchgeführt. Drei verschiedene Verteilungsmuster relativ zum Translationsstartpunkt konnten identifiziert werden, upstream, downstream und indifferent. Es wurde gezeigt, dass eine upstream Verteilung nicht das vorherrschende Verteilungsmuster darstellte. Es war festzustellen, dass die Verteilungsmuster nicht nur vom AT/GC Gehalt abhängen. In einer weiteren Analyse konnte demonstriert werden, dass einige TFBSn (z.B. von AtMYB77) an konservierten Positionen relativ zu den oben benannten Genregionen verschiedener Gene Anreicherungen aufwiesen. Diese konservierte Lokalisation kann auf ähnliche Expressionsmuster der putativen Zielgene hindeuten. Um dies zu analysieren wurden die Expressionsmuster der möglichen Zielgene unter Einsatz von Microarray Genexpressionsdaten untersucht. Signifikante Korrelationen konnten bei den TFs AtMYB77, AtMYB84, AGL15, PIF3 und ATHB5 und ihren putativen Zielgenen identifiziert werden, was auf eine mögliche Koregulation dieser Gene hindeutet.
The genome of the small flowering plant Arabidopsis thaliana is almost completely sequenced and annotated and, therefore, is a valuable resource for bioinformatics. In the studies underlying this thesis, distribution patterns for various transcription factor binding sites (TFBSs) within the A. thaliana genome were determined. Since the genomic distribution pattern of TFBSs may be connected with their AT/GC content, the AT content of gene regions such as UTRs, Introns, Exons, and intergenic regions was assessed at first. It was shown that the starts and the ends of UTRs, Introns, and Exons have preferred nucleotide compositions. In a further step, a genome-wide search for TFBSs of various transcription factors (TFs) was carried out. The search was based on matrices derived e.g. from literature. Then, TFBS distribution patterns relative to translation start site and within the above mentioned gene regions were investigated. Three different distribution patterns, i) upstream, ii) downstream, and iii) indifferent relative to the translation start site were detected. It was shown, that upstream was not the most prominent pattern. It was remarkable that the distribution patterns do not only depend on the AT/GC content. In a further analysis, it was shown that some TFBSs (e.g. of AtMYB77) are located at conserved positions relative to the above mentioned gene regions. This conserved location may indicate a similar gene expression pattern of the putative target genes. To analyse this, the gene expression patterns of candidate genes were determined by using microarrray gene expression data. Significant correlations were found between the TFs AtMYB77, AtMYB84, AGL15, PIF3, and ATHB5 and their corresponding putative target genes indicating a coregulation of these genes.
Preview
Cite
Access Statistic

Rights
Use and reproduction:
All rights reserved