Im strukturierten Datenimport und -export kommen oft CSV-Dateien zur Anwendung. Das Wichtigste über das beliebte CSV-Format und dessen Aufbau finden Sie im folgenden Artikel.
CSV-Dateiformat
CSV ist die englische Abkürzung für comma separated values und beschreibt den Aufbau und die Struktur einer Textdatei. Der Zweck ist dabei die einheitliche Darstellung von Daten, sodass diese zwischen IT-Systemen ausgetauscht werden können. IT-Systeme können dabei zum Beispiel ERP-Systeme, CRM-Systeme oder Datenbanken wie Oracle oder MySQL sein.
Aufbau einer CSV-Datei
Es gibt keinen einheitlichen Standard, der grundlegende Aufbau wird jedoch in RFC 4180 beschrieben. Im Hinblick auf die Zeichenkodierung gibt es auch keine Vorgaben — in der Praxis wird zumeist 7-Bit ASCII verwendet. Der offizielle MIME-Typ ist text/csv.
Die Daten in einer CSV-Datei sind zeilenweise angeordnet, wobei jede Zeile durch einen Zeilenumbruch getrennt ist. Eine Zeile entspricht somit einem Datensatz.
Jede Zeile und damit jeder Datensatz ist wiederum in einzelne Datenfelder aufgeteilt. Die einzelnen Datenfelder sind mit Trennzeichen getrennt, wobei hier Semikolon, Tabulator, Leerzeichen, Komma usw. zur Anwendung kommen können.
Da z. B. Kommawerte auch in Dezimalzahlen vorkommen können, wird ein Datenfeld oft in Anführungszeichen gesetzt. In der ersten Zeile einer CSV-Datei können Kopfdaten stehen, wie z.B. die Bezeichnung der einzelnen Datenfelder.
Zur Veranschaulichung ist im Folgenden eine exemplarische Tabelle abgebildet, wie sie in einem IT-System vorkommen kann.
Ein möglicher CSV-Export dieser Tabelle könnte wie folgt aussehen.
Vorname;Nachname;Geburtsdatum;Postleitzahl "Georg";"Voves";"12.09.1985";"87931" "Hannelore";"Ruthe";"01.03.1975";"65383" "Harald";"Reisinger";"06.05.1981";"30383"
Die erste Zeile beinhaltet die Bezeichnung der Datenfelder und die Zeilen 2 – 4 die entsprechenden Datensätze. Als Trennzeichen für die einzelnen Datenfelder wird in diesem Beispiel ein Semikolon verwendet. Die einzelnen Datenfelder sind mit Anführungszeichen umschlossen.
Anstelle von tabellarischen Strukturen, wie im obigen Beispiel angeführt, können aber auch Listen in ein CSV-Format exportiert werden.
CSV als Basis für EDI
Wird ein CSV-Format für den Import- und den Export von Daten aus einem ERP-System verwendet, kommt zumeist ein listenartiger Aufbau zur Anwendung. Beispielsweise soll folgende Rechnung als CSV-Datei exportiert werden, sodass diese im Anschluss in EDIFACT übersetzt werden kann.
Eine mögliche Struktur könnte wie folgt aussehen.
4739348338389;4311560000000;INVOIC;0 H;4311560034838;27.03.2017;4711;12.03.2017;4712;14.03.2017;4713 P;12;KRT;Fruchtgummi grün;4739348312341;9,50;114,00 P;9;KRT;Fruchtgummi gelb;4739348315540;8,50;76,50 S;190,50;7;13,34;203,84
Hier wird keine tabellarische Struktur herangezogen, sondern je Zeile werden Datensätze unterschiedlicher Länge ausgegeben. Die Identifikation der Datensätze erfolgt dabei über Identifier wie H
, P
etc. Der genaue Aufbau und die Bedeutung der einzelnen Datenfelder müssen in einer entsprechenden CSV-Dokumentation erfasst werden. Es werden nicht notwendigerweise alle Daten exportiert. So wurde beispielsweise auf den Export der Anschriftsdaten verzichtet, da diese für die EDI-Übermittlung keine Rolle spielen. Es reicht die Identifikation anhand der GLN-Nummern.
Für die automatisierte Verarbeitung in einem EDI-System ist vor allem die erste Zeile von großer Bedeutung. Die Werte sind dabei wie folgt zu lesen:
4739348338389
Sender der Nachricht
4311560000000
Empfänger der Nachricht
INVOIC
Dokumenttyp (Rechnung)
0
Testindiktator (1 = Testrechnung, 0 = produktive Rechnung)
Auf Basis dieser vier Parameter kann im EDI-System die korrekte Konvertierung angestoßen werden und die Nachricht anschließend an den Empfänger zugestellt werden.
Noch Fragen?
Sie haben noch Fragen zum Thema ERP-Exportformat oder zum Thema EDI? Zögern Sie nicht und nehmen Sie mit uns Kontakt auf oder benutzen Sie unseren Chat – wir helfen Ihnen gerne weiter!