CSV-Datein mit SQL auswerten
Unsere Anwendungen werden häufig durch Dateien im CSV-Format von externen Anbietern versorgt. Das ist zwar kein wirklicher Standard, aber es ist eine verbreitete Methode, die wir uns tatsächlich nicht aussuchen können. Wenn so etwas einprogrammiert ist, dann ist es in der Praxis auch kein Problem. Dann und wann müssen aber Abweichungen oder Fehler gesucht werden. Wenn dann ebenfalls nur eine CSV-Datei zur Verfügung steht, kann es unangenehm werden. Ich wünschte mir, ich könnte für die Analyse einfach SQL-Statements verwenden.
Genau das geht tatsächlich sehr einfach: Hierfür verwende ich SQLite in Kombination mit SQLiteStudio. Einfach gesagt, wenn man beides nicht im Einsatz hat, reicht es SQLiteStudio zu installieren, weil SQLite dabei gleich mitgeliefert wird.
Zunächst muss eine Datenbank zur Verfügung stehen. Diese kann im Menü "Database" per "Add Database" mit einem Click angelegt werden. Genauso einfach kann dann eine SQLite-Tabelle aus einer CSV-Datei erzeugt werden: Im Menü "Tools" muss "Import" ausgewählt werden. Dann muss noch ein Tabellenname angegeben werden bevor ein Klick auf "Next" zum Importassistenen führt. Dort kann der vorausgewählte "Data source type" "CSV" verwenden werden, um aus der CSV-Datei, die Tabelle zu erstellen.
Sind die Daten importiert, so stehen die Analysemöglichkeiten mit dem Sprachumfang von SQL zur Verfügung (soweit von SQLite unterstützt).
Referenzen