Titelaufnahme

Titel
Extrahierung von Informationen über Proteine in dem PDB Format mittels Biopython
Weitere Titel
Extraction of information about proteins stored in a PDB format using Biopython
VerfasserSchmücker, Anna
GutachterNuzzo, Angelo ; Graf, Alexandra
Erschienen2016
Datum der AbgabeJuli 2016
SpracheDeutsch
DokumenttypBachelorarbeit
Schlagwörter (DE)Protein / Struktur / PDB / Biopyhton
Schlagwörter (EN)Protein / Structure / PDB / Biopython
Zugriffsbeschränkung
 _
Klassifikation
Zusammenfassung (Deutsch)

Protein Strukturen sind für die Analyse von funktionellen Einheiten, Interaktionen und phylogenetische Studien von großer Bedeutung. In den letzten Jahrzehnten sind die experimentellen Daten, welche die Struktur von Proteinen aufklären, exponentiell gestiegen auf Grund technologischer Fortschritte. Diese Daten können in der Protein Datenbank gespeichert werden. Die Dateien dieser Datenbank haben alle eine gemeinsame Struktur, aber unterscheiden sich in der Qualität und Quantität der Daten. Diese Dateien können verwendet werden, um Informationen über ein bestimmtes Protein zu sammeln. Der Code, welcher geschrieben wurde, extrahiert Informationen über Proteine, die in der Protein Datenbank im PDB Datenformat gespeichert sind. Unter der Verwendung von BioPython wurde ein Struktur Objekt erstellt, durch welches man auf Information über den Kopf (header), Ketten, Residuen und Atome zu greifen kann. Außerdem können Abstände und Winkel zwischen Atomen berechnet werden. Eine andere Besonderheit ist, dass die sekundär Struktur berechnet werden kann über das DSSP Programm. Letztendlich kann das Programm auch Protein Strukturen mit einander vergleichen und deren Ähnlichkeit durch den rmsd visualisieren.

Zusammenfassung (Englisch)

Protein structures are important for analyzing functional components of proteins, interactions and for phylogenetic studies. Since the last few decades there has been an exponential growth of experimental data determining the structures of proteins due to technological advances. Those data sets can be deposited in the Protein Data Bank. The files in this databank have a common structure but not the same amount and quality of data. These files can be used to gather information about a certain protein. The script that was written extracts information about proteins that are stored in the Protein Data Bank in a PDB file format. Using BioPython, a structure object is created and information about the header, chains, residues and atoms can be accessed. Also distances between atoms as well as angles between atoms can be calculated. Another feature is that the secondary structured of the residues of the protein can be calculated using the DSSP program. Finally the program is also able to superimpose proteins to each other giving the rmsd to visualize the structure similarity.