XML Stapelverarbeitung

Zweck

Das XML Batch-Element ist dafür konzipiert, sehr große XML-Dateien zu lesen und zu verarbeiten, indem es sie in kleinere, handhabbare Teile, sogenannte „Batches“ (Stapel), unterteilt. Es verwendet einen Stream-Reader, um das Laden der gesamten Datei in den Speicher zu vermeiden, was für die Handhabung riesiger XML-Datensätze unerlässlich ist.

  • Dieses Element fungiert als Ausgangspunkt für eine Stapelverarbeitungsschleife. Der nach diesem Element verbundene Flow-Pfad wird für jeden aus der XML-Datei gelesenen Stapel von Datensätzen (Knoten) einmal ausgeführt, bis die gesamte Datei verarbeitet wurde.

Anwendungsfälle:

  • Importieren eines großen Produkt-Feeds von einem Lieferanten im XML-Format.

  • Verarbeiten großer, komplexer XML-Datenexporte aus Unternehmenssystemen.

  • Lesen und Synchronisieren von Daten aus einer riesigen XML-Datei, ohne an Speichergrenzen zu stoßen.


Praktische Anwendungshinweise

  • Stapelverarbeitungsschleife: Dieses Element initiiert eine Schleife. Wenn Sie beispielsweise eine XML-Datei mit 5.000 <item>-Datensätzen und einer Stapelgröße von 500 haben, wird der nachfolgende Flow-Pfad 10 Mal ausgeführt.

  • Kombination mit "For Each": Ein gängiges Muster ist die Verbindung dieses Elements mit einer For Each-Schleife. Das XmlBatch-Element holt einen Stapel von Datensätzen (z. B. 500), und die For Each-Schleife iteriert dann über jeden einzelnen dieser Datensätze, um ihn zu verarbeiten.

  • Ziel-Tag ist entscheidend: Im manuellen Modus ist die korrekte Identifizierung des Ziel XML-Tag der wichtigste Schritt. Dies teilt dem Parser mit, was eine einzelne „Zeile“ von Daten in Ihrer Datei definiert.


Konfigurationsoptionen

Datei- und Stapeleinstellungen

Option

Beschreibung

Eingabeformat

Beispielwert

XML-Pfad

Der Pfad zur .xml-Datei im Speicher der Plattform, die verarbeitet werden soll.

String (Dateipfad).

/importe/produkt_feed.xml

Stapelgröße

Die Anzahl der Haupt-XML-Knoten (Datensätze), die für jeden Stapel gelesen werden sollen. (Pflichtfeld).

Integer.

500

Datei archivieren

Wenn aktiviert, wird die Quell-XML-Datei nach vollständiger Verarbeitung in ein Archivverzeichnis verschoben.

Checkbox (Boolean).

true

Struktur-Konfiguration

Option

Beschreibung

Eingabeformat

Typ

Definiert, wie das Element die XML-Datei interpretiert: Manuell (Definieren Sie Tags) oder Datenstruktur (Verwenden Sie eine vorkonfigurierte Struktur).

Auswahl (Dropdown).

Datenstruktur

Wählen Sie eine vordefinierte Datenstruktur aus, um die XML-Datei automatisch zu parsen. (Erscheint nur, wenn der Typ auf Datenstruktur gesetzt ist).

Auswahl verfügbarer Datenstrukturen.

Manuelle Konfigurationseinstellungen (bei Typ Manuell)

Option

Beschreibung

Eingabeformat

Beispielwert

Codierung

Die Zeichenkodierung der XML-Datei.

String.

UTF-8

Ziel XML-Tag

Der Name des sich wiederholenden XML-Tags, das einen einzelnen Datensatz darstellt (z.B. <produkt>).

String.

produkt

Array erzwingen bei

Eine Liste von verschachtelten XML-Tag-Namen, die immer als Array behandelt werden sollen, auch wenn nur ein Tag existiert (für konsistente Datenstrukturen).

Eine Liste von Tag-Namen.

bild


Eingabe-/Ausgabe-Erwartungen

  • Eingabe: Das Element benötigt mindestens den XML-Pfad.

  • Ausgabe: Die primäre Ausgabe ist die Variable Einträge.

    • Diese Variable enthält ein JSON-Array der Datensätze (geparst aus den Ziel-XML-Tags) im aktuellen Stapel.

    • Der nachfolgende Flow-Pfad wird wiederholt ausgeführt, einmal für jeden Stapel, bis die gesamte Datei verarbeitet ist.


Zuletzt aktualisiert

War das hilfreich?