Generierung einer dynamischen Keimbahn-V-Gendatenbank und in-silico-Charakterisierung des Immunoglobulin-Schwerekettenlocus des Mausstammes 129/Sv
Die vorliegende Arbeit beschäftigt sich mit der in-silico-Analyse von antikörper- kodierenden DNA- Sequenzen. Zum einen wurde ein automatischer V-Gen-Analyse- Prozess entwickelt, mit dem die Datenbank VBASE2 erzeugt wird. Zum anderen wurde mit Unterstützung der automatischen V-Gen-Analyse und weiteren bioinformatischen Methoden die genomische Sequenz des Immunglobulin-Schwerekettenlocus (IgH- Locus) des Mausstammes 129/Sv untersucht und annotiert. Der Prozess zur automatischen V-Gen-Analyse führt eine systematische Sortierung und Klassifizierung der V-Gen-Sequenzen der EMBL-Bank durch. Die durch den Prozess generierte Datenbank VBASE2 ist eine integrative Keimbahn-V-Gen-Datenbank, deren Einträge Verweise auf die EMBL-Bank, andere immunologische Datenbanken und auf Ensembl enthalten. Über den Ensembl DAS Server können VBASE2-V-Gene im Ensem- bl Genombrowser dargestellt werden. Die V-Gen-Einträge von VBASE2 sind in Klassen unterschiedlicher Qualität eingeteilt, die die Zuverlässigkeit der jeweiligen Sequenz widerspiegeln. Der aktuelle Datensatz von VBASE2 beinhaltet 1129 Keimbahn-V-Gene, -Pseudogene, V-Gen-Relikte und Orphans der Immunglobulinloci von Mensch und Maus. Auf der Grundlage des VBASE2-Generierungsprozesses wurde ein Modul für die Proteindatenbank UniProtKB/TrEMBL entwickelt, das den Eingang von Immunglobu- linsequenzen in diese automatisch erzeugte Datenbank kontrolliert. Weiterhin wurde der Prozess für die Annotation der V-Segmente des IgH-Locus des Mausstammes 129/Sv genutzt. Der in der vorliegenden Arbeit untersuchte Teil des IgH-Locus umfasst mit 1,4 Mb die konstante Region, D-Region, J-Region und etwa ein Drittel der variablen Region. Durch die Annotation dieser Sequenz konnten neue V- und D-Segmente be- schrieben werden. Vier V-Gen-Relikte und ein funktionelles V-Gen der Vh7183- und der VhQ52-Familie liegen jeweils als exakte Duplikationen vor. Sequenzvergleiche der D- Region von 129/Sv zeigen deutliche Unterschiede sowohl zum Igha- (Stamm BALB/c) als auch zum Ighb- (Stamm C57BL/6) Haplotyp. Eine Untersuchung der repetitiven Elemente im IgH-Locus von 129/Sv ergab unter anderem einen ungewöhnlich hohen Anteil an LINE1-Elementen. Die hier beschriebene Charakterisierung des IgH-Locus der 129/Sv-Maus setzt die am Mausstamm C57BL/6 begonnene Arbeit fort und trägt zur Aufklärung dieses komplexen Locus im Modellorganismus Maus bei.
Generation of a dynamic germ-line V gene database and in-silico characterisation of the immunoglobulin heavy chain locus of the mouse Focus of this thesis is on the in-silico analysis of antibody coding DNA sequences. Firstly, an automatic V gene analysis procedure has been developed which generates the database VBASE2. Secondly, this prodedure and other bioinformatic applications have been used to analyse and annotate the genomic sequence of the immunoglobulin heavy chain locus (IgH locus) of the mouse strain 129/Sv. The automatic V gene analysis procedure performs a systematical sorting and classification of all V genes in the EMBL-Bank. The resulting database VBASE2 is an integrative germ-line V gene database, where each entry links to the EMBL-Bank, Ensembl and immunological databases. The implementation of an Ensembl DAS server allows the display of VBASE2 V genes within the Ensembl genome browser. V gene entries are assigned into different classes, reflecting differences in the reliability of a sequence. The dataset comprises functional and pseudo V genes, relics and orphans from the immunoglobulin loci of human and mouse. The V gene analysis procedure has further been used to annotate the V genes in the IgH locus of the mouse strain 129/Sv. The available elucidated genomic sequence covers the constant region and approximately one third of the variable region. The analysis of this sequence revealed new V and D genes. The comparison of the 129/Sv D region with the homologous regions in C57BL/6 and BALB/c exhibited considerable differences between these inbred mouse strains. The portion of interspersed repeats within the variable region is exeptionally high compared to the average of the genome. The characterisation of the IgH locus of 129/Sv complements the knowledge of this locus in C57BL/6 and contributes to a profound comprehension of this complex locus.
Preview
Cite
Access Statistic

Rights
Use and reproduction:
All rights reserved