Titelaufnahme

Titel
An automated bioinformatic workflow for the analysis of smallRNA next-generation sequencing data
Weitere Titel
Ein automatisierter, bioinformatischer Workflow für die Analyse von smallRNA next-generation Sequenzierdaten
AutorInnenBindeus, Alexander
Begutachter / BegutachterinHackl, Matthias
Erschienen2018
Datum der AbgabeOktober 2018
SpracheEnglisch
DokumenttypMasterarbeit
Schlagwörter (EN)Workflow / smallRNA / microRNA / NGS Daten / Differential Expression Analyses
Zugriffsbeschränkung
 _
Klassifikation
Zusammenfassung (Deutsch)

Im Rahmen einer temporären Teilzeitanstellung bei TAmiRNA GmbH wird eine Analyse-Pipeline zur Auswertung von smallRNAs aus next-generation Sequencing Daten erstellt.

Während das Hauptaugenmerk dabei der Bestimmung von differentiell exprimierten microRNAs gilt, können de facto alle Spezies von smallRNAs für welche Sequenzbibliotheken vorliegen untersucht werden.

Die erstellte Software vermag alle gängigen Dateiformate von Sequenzierdaten zu verarbeiten und erlaubt die Bearbeitung einer beliebigen Anzahl von Eingangsproben.

Ausgehend von den Rohdaten werden alle bioinformatorisch nötigen Arbeitsschritte bis hin zur Ausgabe fertiger Ergebnisberichte und Tabellen vollständig automatisiert durchgeführt.

Zur Kontrolle der Sequenzierqualität wird dabei ein eigenständiger Report erstellt welcher die entsprechenden Kenngrößen aller verwendeten Eingangsdaten zusammengefasst darstellt.

Ein weiterer Bericht beinhaltet eine Übersicht über die Zusammensetzung der jeweiligen smallRNA Spezies als auch die Ergebnisse der Analyse der differentiell exprimierten small RNAs. Diese Dokumente können wahlweise in Form von interaktiven html oder auch im statischen pdf Format erzeugt werden. Zudem erlauben formatierte MS Excel Dateien eine problemlose Weiterbearbeitung der gewonnenen Ergebnisse.

Sowohl Layout, als auch Inhalt der Endberichte berücksichtigen die speziellen Anfordungen von TAmiRNA GmbH respektive ihrer Kunden.

Zur leichten Handhabung der Analyse Pipeline wird ein Graphical User Interface (GUI) erstellt welches die anwenderfreundliche Einstellung und Manipulation der essentiellen Parameter gewährleistet.

Mit Hilfe der entwickelten Software konnten erste Kundenprojekte bereits erfolgreich

Zusammenfassung (Englisch)

In the context of a temporal part time employment at TAmiRNA GmbH a software pipeline for analysis of smallRNAs in next-generation sequencing data is developed.

Whilst the focus is put on evaluation of differentially expressed microRNAs de facto all species of smallRNAs for which sequence libraries are available can be examined.

The elaborated workflow is capable of handling all commonly used file formats in sequencing and enables the analysis of an arbitrary number of input samples. All necessary bioinformatic processing steps starting from initially raw data until the final creation of output reports and tables are fully automated.

In order to enable quality checks of the sequencing data a special report is generated which summarizes all relevant quality related data of all individual input files.

Another report provides a survey about the content of small RNA species of interest as well as the results of the differential expression analysis. These documents may alternatively be rendered into interactive html or static pdf files. Moreover additionally created, well formatted MS excel, files enable easy downstream analysis of the obtained

results.

The layout as well as the content of the generated outputs take into account the special requirements of TAmiRNA GmbH and its clients respectively.

For the purpose of easy usage of the analysis pipeline a Graphical User Interface (GUI) is developed which enables user-friendly adjustment and manipulation of the essential parameters.

Multiple projects have already been successfully processed by using the elaborated

software.