Titelaufnahme

Titel
Performance-Vergleich der cloudbasierten dokumenten-orientierten Datenbanken
Weitere Titel
Comparison of Performance of Cloud-based Document-oriented Databases
AutorInnenVoth, Mi Ji
GutachterGöschka, Karl Michael
Erschienen2018
Datum der AbgabeMärz 2018
SpracheDeutsch
DokumenttypBachelorarbeit
Schlagwörter (DE)Cloud Computing / Big Data / NoSQL / Amazon DynamoDB / Google Cloud Datastore / Mongo DB / Performance-Vergleich / YCSB
Schlagwörter (EN)Cloud Computing / Big Data / NoSQL / Amazon DynamoDB / Google Cloud Datastore / Mongo DB / Comparison of Performance / YCSB
Zugriffsbeschränkung
 _
Klassifikation
Zusammenfassung (Deutsch)

Der rasante Anstieg von Datenmengen wird täglich von Datenerzeugern und den von den gewonnenen Informationen profitierenden Verbrauchern herbeigeführt.

Die Datenflut, die als Big Data bezeichnet wird, beeinflusst unmittelbar das Umfeld der heutigen Generation. Dennoch ist die Verarbeitung solcher Daten, die in beliebiger Form und Mengen vorliegen, nicht einfach mittels traditioneller relationaler Datenbanken zu bewältigen. Eine Problemlösung liegt in der Entwicklung von NoSQL-Datenbanken mit ihrer Möglichkeit der horizontalen Skalierbarkeit.

Die vorliegende Arbeit beschäftigt sich mit dem Vergleich dokumenten-orientierten Datenbanken, welche eine Unterkategorie der NoSQL-Datenbanken darstellen, in Bezug auf ihre Performance. Als die zu evaluierenden Datenbanken wurden Amazon Dynamo DB und Google Cloud Datastore ausgewählt, die von den führenden Cloud Services Amazon Web Services und Google Cloud Platform entwickelt wurden. Dazu wurde die derzeit am meisten verwendete dokumenten-orientierte Datenbank Mongo DB gegenüberstellend in die Benchmark einbezogen.

Für die Benchmark wurde das Open-Source-Benchmark-Tool Yahoo! Cloud Serving Benchmark (YCSB) verwendet, das von Yahoo entwickelt wurde. YCSB bietet die Möglichkeit, mehrere Datenbanken, unabhängig von ihren Unterschieden, mit vordefinierten Workloads und Datenbank-Schnittstellen hinsichtlich der Performance zu evaluieren.

Es wurden vier verschiedene Workloads ausgeführt, die jeweils aus der Operationenkombinationen Einfügen, Ändern und Lesen von Datensätzen bestehen.

Die Benchmark-Ergebnisse zeigen, dass sowohl Amazon DynamoDB als auch Google Cloud Datastore

gegenüber der führenden Datenbank Mongo DB nicht konkurrenzfähig sind, wobei sich Amazon DynamoDB bei allen Benchmark-Vorgängen im Vergleich zu Google Cloud Datastore als leistungsfähiger erwiesen hat.

Insbesondere beim Einfügen und Ändern von Datensätzen zeigt sich Mongo DB weit überlegen. Amazon DynamoDB und Google Cloud Datastore werden von ihren jeweiligen Cloud Services zwar vollständig verwaltet, liegen hingegen hinsichtlich ihrer Leistungen auf einem deutlich niedrigeren Niveau als Mongo DB. Um den Anforderungen an die heutigen Applikationen gerecht zu werden, muss eine Möglichkeit dynamischer Änderungen gewährleistet werden. Mongo DB erfüllt diese Voraussetzungen und ist als eine leistungsfähige dokumenten-orientierte Datenbank zu empfehlen

Zusammenfassung (Englisch)

The rapid growth of data daily results by data producers and consumers, who profit from the information gained from these data. The flood of data, which is also called Big Data, directly influences the environment of today’s generation. Nevertheless, the processing of such data, which appear in a random form and quality, cannot be done by traditional relational databases. One solution to this problem lies in the development of NoSQL databases with their capability of horizontal scalability.

In this paper, I draw a comparison between document-based databases, which constitute a sub-category of NoSQL databases, with regard to their performance. I chose to evaluate the databases developed by the leading Cloud Services Amazon Web Services and Google Cloud Platform. In addition, the most frequently used document-based database Mongo DB was contrastively taken into the benchmark.

The benchmark was carried out by using the open source benchmark tool Yahoo! Cloud Serving Benchmark (YCSB), which was developed by Yahoo. YCSB enables a performance evaluation of several databases with predefined workloads and database interfaces, regardless of the differences between these databases. Four different workloads were carried out, consisting of operation combinations insert, update and read of data sets.

The benchmark results show that both Amazon DynamoDB and Google Cloud Datastore are not competitive in comparison with the leading database Mongo DB, whereas Amazon DymanoDB has proved more efficient in all benchmark runs than Google Cloud Datastore. Especially with operations insert and update of data sets,

Mongo DB is clearly more efficient. Amazon DynamoDB and Google Cloud Datastore are surely fully administrated by their respective cloud services, but their performance level is definitely lower than Mongo DB. In order meet the requirements for today’s applications, they have to be capable of dynamic editing. Mongo DB complies with these requirements and can be recommended as an efficient document-based database.