Titelaufnahme

Titel
Outlier Detection in heterogenen IT-Umgebungen
Weitere Titel
Outlier detection in heterogeneous IT infrastructures
VerfasserHaidn, Friedrich
GutachterKoschuch, Manuel
Erschienen2012
Datum der AbgabeMai 2012
SpracheDeutsch
DokumenttypBachelorarbeit
Schlagwörter (DE)3-Sigma Control Limit / Chi-Quadrat / Data Mining / Eventkorrelation / Hotelling’s T-Quadrat / Hypothesentests / IT-Sicherheit / k-Means-Clustering / Multivariate statistisch mathematische Methoden
Schlagwörter (EN)3-sigma control limit / chi-square / data mining / event correlation / Hotelling's t-square / hypothesis testing / IT security / k-Means clustering / multivariat statistics mathematical analysis
Zugriffsbeschränkung
 _
Klassifikation
Zusammenfassung (Deutsch)

Diese Arbeit beschäftigt sich mit der Anwendung von multivariat statistisch Mathematischen zur Erkennung von Anomalien und Outlier in Logdaten heterogener IT-Systeme. Es soll ein Überblick über die der Thematik zu Grunde liegenden Anforderungen der IT-Sicherheit, der Heterogenität von IT-Infrastrukturen und der Problematik der Datenanalyse in diesem Zusammenhang gegeben werden.

Neben der Beleuchtung der Grundlagen von multivariat statistisch mathematischen Verfahren sollen bereits in der Literatur erwähnte und praktisch erprobte Verfahren zu Hypothesentests vorgestellt werden. Neben dem X²- und Hotelling’s T²-Test soll auch das k-Means-Verfahren zur Clusteranalyse diskutiert werden.

Der praktische Teil der Arbeit beschäftigt sich mit der Implementierung der vorgestellten Verfahren in einem Eventkorrelationssystem. Anhand von anonymisierten Logdaten aus einer Echtumgebung sollen die Methoden in der praktischen Anwendung unter Beweis gestellt werden.

Die im Zuge der thematischen Auseinandersetzung entstandene virtuelle Umsetzungsumgebung soll als Beilage zur Arbeit eine vollständige Transparenz in Hinblick auf die Implementierung und Anwendung der Methoden sicherstellen.

Zusammenfassung (Englisch)

This bachelor thesis focuses on the usability of mathematical multivariate statistical analysis in conjunction with the detection of anomalies and outlier in log data originated by heterogeneous IT infrastructures. An overview ranging from the requirements of IT security the heterogeneity of IT infrastructures to the complexity of data analytics shall be given.

In addition to the introduction to the basics of mathematical multivariate statistical methods for data analysis, hypothetical test methods already mentioned in literature and tested in practice shall be presented. This concludes a discussion about X²-Test, Hotelling’s T²-Test and "k means clustering" analysis.

The practical part of the thesis deals with the implementation of the introduced methods within an event correlation system. Based on anonymised data originated by a live environment those methods shall put their ability to test.

The virtual integration environment, which will be a result of the course of examination in conjunction with the topic, shall ensure full transparency in terms of the implementation of the methods and their employment.