Kettle: Reporterstellung – Pentaho HowTo Teil 3

In diesem Tutorial zeigen wir euch, wie man in Kettle einen Job bzw. eine Transformation erstellt. Kettle ist eine Data Integration von Pentaho, mit der man unter anderem Reporte erstellen kann. Allerdings gibt es noch viele andere Möglichkeiten Kettle zu nutzen und vor allem die Erstellung des Reportes zu optimieren. Dazu kann man die Reporte auch automatisch erstellen lassen, indem man die Jobs und Transformations auf dem BI Server hoch lädt.

  1. Zunächst musst du dir von sourceforge.net eine „pdi-ce“-Datei herunterladen.
  2. Entpacke die Zip-Datei in ein Verzeichnis deiner Wahl.
  3. Öffne in dem Ordner die Spoon-Batchdatei. (Zum Öffnen wird eine Java jre-Version benötigt)

Nun hast du die Oberfläche zum Erstellen von Kettle Jobs und Transformations offen und kannst deinen Ablauf zur Reporterstellung entwickeln. Zunächst ist es wichtig zu wissen, was einen Job und eine Transformation unterscheidet. Dies ist relativ simpel: Ein Job steuert, eine Transformation macht. Das bedeutet, dass der Ablauf von dem Job abhängig ist und die Transformation einen Report erstellt oder andere Aktionen ausführt. Also ist eine Transformation einem Job unterstellt und der Job muss die Transformation ausführen, wie im Bild zu sehen.

Wir haben dir außerdem solch einen Ablauf eines Kettle Jobs mit einer Transformation bereitgestellt (Download: pentaho_kettle). Das Beispiel beinhaltet einen Aufruf einer Transformation, die einen Beispielreport von Pentaho erstellt. In diesem Fall hat die Reportvorlage von Pentaho keine Parameter, allerdings wäre dies nicht schwer einzustellen, da es im Schritt „Pentaho Reporting Output“ (der Schritt in dem der Report erzeugt wird) einen Button mit „Get Report Parameters“ gibt, bei dem die Parameter aus der Vorlage direkt geholt werden. In unserem Beispiel stellen wir es recht statisch dar, was man natürlich auch ändern kann, indem man sich Daten aus Dateien oder einer Datenbank holt. Dazu kann man z.B. den „Table Input“-Schritt verwenden, mit dem man mit Hilfe eines SQL Query ein SELECT auf die Datenbank ausführen kann.

Wenn du ein normales SQL Query ausführen willst, um z.B. Daten in eine Datenbank zu schreiben, verwendest du den „Execute SQL script“-Schritt.

Der „Generate Rows“-Schritt in unserem Beispiel wird benutzt, um eine virtuelle Zeile zur Verarbeitung zu erstellen, da bei einer Transformation immer alle Schritte pro Zeile aus einem Input parallel verarbeitet werden. Das ist auch ziemlich sinnvoll, denn wenn man mehrere Daten aus einer Datenbank holt, werden diese gleichzeitig verarbeitet, also kann man mit Kettle auch mehrere Reporte gleichzeitig erstellen. Jedoch kann man dadurch in eine Transformation keine Schleife einbauen, was allerdings in einem Job möglich ist, da dort alle Schritte nacheinander und nur einmal ausgeführt werden.

Anhand der Fülle der Möglichkeiten von Kettle können wir dir natürlich keine Ausführliche Beschreibung von allen Elementen geben. Dort verweisen wir auf die Doku von Pentaho, die zu allen Elementen eine kurze Beschreibung gibt. Außerdem werden wir in zukünftigen Beiträgen noch weitere Besonderheiten von einigen Elementen vorstellen.

Wie du einen Report auch ohne Kettle automatisch erstellen kannst, erfährst du hier: Report über BI Server erstellen – Pentaho HowTo Teil 2.

Kommentar schreiben

  • (benötigt)
  • (benötigt)