Computational methods for characterizing viral neutralization data and predicting linear B-cell epitopes
Vaccines play a very crucial role in the control and prevention of several infectious diseases worldwide. However, there are many pathogens (such as HCV, HIV) against which a vaccine has not been developed and a preventive vaccine against such pathogens still evades researchers. Identifying neutralizing antibodies and new epitopes on the antigens are some of the ways that could improve our understanding of the immune response against these pathogens and subsequently help in developing new vaccines against them. Experimental methods for these tasks are expensive and time-consuming and this advocates for use of computational methods to accelerate research in these fields. In this thesis, I have developed two computational methods that would aid researchers in these tasks. Firstly, I analysed Hepatitis C neutralization data and then created a neutralization map for HCV using multidimensional scaling. This neutralization cartography allowed us to select a reduced reference panel for testing the breadth and potency of antibodies (and vaccines) against HCV. The panel also allowed us to select patients that develop the most potent antibodies, which are able to neutralize several HCV strains. I have created a pipeline for automating this method and it can potentially be utilized for other viruses as well. Secondly, I have created a new machine learning-based method called EpitopeVec for predicting linear B-cell epitopes on antigenic proteins. Although several methods for predicting linear B-cell epitopes have been published, their generalizability and accuracy in cross-testing is not satisfactory. Therefore, I also benchmarked many recently published methods on several datasets extensively for their generalizability and compared their performance with my method. The performance of the EpitopeVec method was better than the state-of-the-art methods in five-fold cross-validation as well as cross-testing. As the prediction performance of the methods depended on the type of antigens, I also created an EpitopeVec-viral method for predicting linear B-cell epitopes specifically for viral antigenic proteins. With these methods, this dissertation aims to aid researchers in immunology and furthering vaccine research.
Impfstoffe spielen bei der Bekämpfung und Vorbeugung verschiedener Infektionskrankheiten weltweit eine sehr wichtige Rolle. Es gibt jedoch viele Krankheitserreger (z. B. HCV, HIV), gegen die noch kein Impfstoff entwickelt wurde, und ein präventiver Impfstoff gegen solche Krankheitserreger steht. Die Identifizierung neutralisierender Antikörper und neuer Epitope auf den Antigenen sind einige der Möglichkeiten, die unser Verständnis der Immunreaktion gegen diese Krankheitserreger verbessern und in der Folge zur Entwicklung neuer Impfstoffe gegen sie beitragen könnten. Experimentelle Methoden für diese Aufgaben sind teuer und zeitaufwendig, was für den Einsatz von Computermethoden spricht, um die Forschung auf diesen Gebieten zu beschleunigen. In dieser Arbeit habe ich zwei Berechnungsmethoden entwickelt, die den Forschern bei diesen Aufgaben helfen sollen. Zunächst analysierte ich Hepatitis-C-Neutralisierungsdaten und erstellte dann eine Neutralisierungskarte für HCV mithilfe der multidimensionalen Skalierung. Diese Neutralizationskarte ermöglichte es uns, ein reduziertes Referenzpanel auszuwählen, um die Breite und Wirksamkeit von Antikörpern (und Impfstoffen) gegen HCV zu testen. Das Panel ermöglichte es uns auch, Patienten auszuwählen, die die stärksten Antikörper entwickeln, die in der Lage sind, mehrere HCV-Stämme zu neutralisieren. Ich habe eine Pipeline zur Automatisierung dieser Methode entwickelt, die potenziell auch für andere Viren eingesetzt werden kann. Zweitens habe ich eine neue, auf maschinellem Lernen basierende Methode namens EpitopeVec zur Vorhersage von linearen B-Zell-Epitopen auf antigenen Proteinen entwickelt. Obwohl bereits mehrere Methoden zur Vorhersage linearer B-Zell-Epitope veröffentlicht wurden, ist ihre Verallgemeinerbarkeit und Genauigkeit bei Kreuztests fraglich. Daher habe ich auch viele kürzlich veröffentlichte Methoden anhand mehrerer Datensätze ausführlich auf ihre Verallgemeinerbarkeit geprüft und ihre Leistung mit meiner Methode verglichen. Die Leistung der EpitopeVec-Methode war sowohl bei fünffacher Kreuzvalidierung als auch bei Kreuztests besser als die modernsten Methoden. Da die Vorhersageleistung der Methoden von der Art der Antigene abhängt, habe ich auch eine EpitopeVec-viral-Methode zur Vorhersage linearer B-Zell-Epitope speziell für virale antigene Proteine entwickelt. Mit diesen Methoden soll diese Dissertation Forschern in der Immunologie helfen und die Impfstoffforschung fördern.