XLSX Stapelverarbeitung

Zweck

Das XLSX Batch-Element ist dafür konzipiert, sehr große Microsoft Excel (.xlsx)-Dateien in kleineren, handhabbaren Teilen, sogenannten „Batches“ (Stapeln), zu lesen und zu verarbeiten. Dieser speichereffiziente Ansatz vermeidet Fehler, die auftreten können, wenn versucht wird, eine riesige Tabelle auf einmal zu laden.

  • Dieses Element fungiert als Ausgangspunkt für eine Stapelverarbeitungsschleife. Der nach diesem Element verbundene Flow-Pfad wird für jeden aus der XLSX-Datei gelesenen Stapel von Zeilen einmal ausgeführt, bis das gesamte ausgewählte Arbeitsblatt verarbeitet wurde.

Anwendungsfälle:

  • Importieren großer Produktkataloge oder Benutzerlisten aus einer Excel-Datei.

  • Verarbeiten von Finanzberichten mit mehreren Blättern, bei denen jedes Blatt einzeln behandelt werden muss.

  • Lesen und Synchronisieren von Daten aus einer großen XLSX-Datei, ohne an Speichergrenzen zu stoßen.


Praktische Anwendungshinweise

  • Stapelverarbeitungsschleife: Dieses Element initiiert eine Schleife. Wenn Sie beispielsweise eine Tabelle mit 25.000 Zeilen und eine Stapelgröße von 5.000 haben, wird der nachfolgende Flow-Pfad 5 Mal ausgeführt.

  • Kombination mit "For Each": Ein gängiges Muster ist die Verbindung dieses Elements mit einer For Each-Schleife. Das XlsxBatch-Element liefert einen Stapel (z. B. 1000 Zeilen), und die For Each-Schleife iteriert dann über jede dieser 1000 Zeilen, um sie einzeln zu verarbeiten.

  • Arbeitsblätter gezielt auswählen: Geben Sie immer einen Sheet-Namen an, wenn Ihre XLSX-Datei mehrere Arbeitsblätter enthält. Wenn das Feld leer gelassen wird, wird standardmäßig das erste Arbeitsblatt verwendet.


Konfigurationsoptionen

Datei- und Stapeleinstellungen

Option

Beschreibung

Eingabeformat

Beispielwert

XLSX-Pfad

Der Pfad zur .xlsx-Datei im Speicher der Plattform, die verarbeitet werden soll.

String (Dateipfad).

/importe/monatsverkaeufe.xlsx

Sheet

Der Name des spezifischen Arbeitsblattes, das Sie aus der XLSX-Datei lesen möchten. Standardmäßig das erste Arbeitsblatt, wenn leer.

String.

Q2-Verkaeufe

Stapelgröße

Die Anzahl der Zeilen, die für jeden Stapel gelesen werden sollen. (Pflichtfeld).

Integer.

1000

Datei archivieren

Wenn aktiviert, wird die Quell-XLSX-Datei nach vollständiger Verarbeitung in ein Archivverzeichnis verschoben.

Checkbox (Boolean).

true

Kopfzeilen- und Datenbereichseinstellungen

Option

Beschreibung

Eingabeformat

Beispielwert

Datei enthält Überschriften

Gibt an, ob die erste Zeile Ihrer Daten eine Kopfzeile ist.

Auswahl (Ja/Nein).

Ja

Überschriften

(Nur bei „Nein“) Wenn die Datei keine Kopfzeile enthält, müssen Sie hier die Spaltennamen (Schlüssel) in der richtigen Reihenfolge definieren.

Eine Liste von Namen.

["produkt_id", "name", "preis"]

Offset

Die Anzahl der Zeilen, die am Anfang des Arbeitsblattes übersprungen werden sollen.

Integer.

Limit

Die maximale Gesamtzahl der Zeilen, die nach dem Offset aus dem Arbeitsblatt gelesen werden sollen.

Integer.


Eingabe-/Ausgabe-Erwartungen

Eingabe

Das Element benötigt mindestens den XLSX-Pfad.

Ausgabe

Die primäre Ausgabe ist die Variable Einträge.

  • Diese Variable enthält ein JSON-Array der Zeilen im aktuellen Stapel.

  • Jede Zeile ist ein Objekt, bei dem die Schlüssel aus der Kopfzeile oder der manuellen Überschriften-Konfiguration abgeleitet sind.

  • Der nach diesem Element verbundene Flow-Pfad wird wiederholt ausgeführt, einmal für jeden Stapel, bis alle Zeilen innerhalb des Limit verarbeitet sind.


Zuletzt aktualisiert

War das hilfreich?