Big Data Profiling mit Talend

Eine neue Version der Produkt-Suite der Softwarefirma Talend bietet unter anderem Big Data Profiling, NoSQL-Integration und Parallelisierung auf Multi-Core-Hardware.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Julia Schmidt

Die Firma Talend hat Version 5.2 ihrer Softwaresuite zum Integrieren von Daten, Anwendungen und Prozessen veröffentlicht. Schwerpunkt des Updates waren Funktionen für den Umgang mit Big Data und NoSQL-Konnektivität.

So wurde die Talend Platform for Big Data um eine Data-Profiling-Option ergänzt, mit der Entwickler Daten in Hive-Datenbanken in Hadoop "vor Ort" analysieren können sollen. Die Anwendung liefert einen Bericht, der die Qualität der gespeicherten Datennach Kriterien wie fehlende Werten oder Duplikaten sowie mittels Validierung bestimmter Eingaben bewertet. Die dazu durchzuführenden Tests sollen anpassbar sein.

Platform for Big Data und Open Studio for Big Data unterstützen darüber hinaus nun auch Cassandra, HBase und MongoDB. Weitere Neuerungen, die allerdings auf die kommerziellen Versionen beschränkt sein sollen, umfassen die Möglichkeit, Aufgaben auf Multicore-Hardware parallel auszuführen, und eine den Build-Manager Maven nutzende Continous-Integration-Funktion. Talends Enterprise MDM System ist in Version 5.2 auch mit Oracle, MySQL, Derby oder H2-Datenbanken zu nutzen.

Talends Produkte sind als "Community"-Editionen unter GPLv2 erhältlich, die kommerziellen Versionen der 5.2-Reihe werden bis Ende des Jahres zur Verfügung gestellt. (jul)