Titelaufnahme

Titel
Datenimport von delimited Files ohne Verwendung von Metadaten
Weitere Titel
Importing delimited files without using metadata
VerfasserPemsel, Thomas
Betreuer / BetreuerinRadinger-Peer, Wolfgang
Erschienen2016
Datum der AbgabeAugust 2016
SpracheDeutsch
DokumenttypBachelorarbeit
Schlagwörter (DE)CSV Import / Delimited File Import / Automatisierung / Datenanalyse
Zugriffsbeschränkung
 _
Klassifikation
Zusammenfassung (Deutsch)

Heutzutage werden größere Mengen an tabellarischen Daten oft noch mittels einer oder mehreren CSV Dateien verteilt. Der Vorteil daran ist, dass ohne systemspezifische Formate ein hohes Maß an Kompatibilität zwischen verschiedenen Systemen ermöglicht wird und der Export der Daten einfach zu handhaben ist. Der Import von solchen Daten ist aber schwerer, da viele Metainformationen aus der Quelldatenbank durch den Export verloren gehen.

Diese Arbeit beschäftigt sich damit, wie Plain-Text Dateien im CSV Format mit so wenig Metadaten wie möglich in eine Datenbank importiert werden können, damit die Daten danach auch sofort nutzbar sind. Dabei werden drei Varianten besprochen: Als Erstes wird eine Eigenentwicklung des Import-Prozesses mithilfe des .Net Frameworks theoretisch analysiert. Dabei wird auf mögliche Fälle eingegangen, wie Daten in einer CSV Datei formatiert werden können. Danach wird ein Import über die frei verfügbare Open-Source Programm-Bibliothek "FileHelpers" durchgegangen. Als Letztes werden verschiedene Tools analysiert, die bei Datenbanken inkludiert sind und verwendet werden können um CSV Dateien zu importieren.

Es werden die Vor- und Nachteile analysiert und dabei die Einfachheit und Geschwindigkeit des Aufsetzens der jeweiligen Lösung bewertet. Dabei zeigt sich, dass bei vorgefertigten Lösungen immer Informationen über die zu importierenden Dateien am Zielsystem vorhanden sein müssen. Deswegen ist, wenn ein Import komplett ohne Metadaten funktionieren soll, die Eigenentwicklung trotz des Initialen Aufwandes die beste Lösung.

Zusammenfassung (Englisch)

-