Fast Data: Apache Kudu 1.15 verabschiedet sich von älteren Python-Versionen

Der Open-Source-Datenspeicher stellt den Support für ältere Python-Versionen ein und bringt Neuerungen für Kudu-Tabellen.

In Pocket speichern vorlesen Druckansicht

(Bild: alphaspirit/Shutterstock.com)

Lesezeit: 2 Min.

Apache Kudu, eine Ergänzung für den Storage Layer von Hadoop zur schnellen Analyse von Fast Data, liegt in Version 1.15 vor. Mit dem Update verabschiedet sich der Open-Source-Datenspeicher von der kuda-mapreduce-Integration und markiert den Support für Python 2.x und Python 3.4 sowie früheren Versionen als deprecated (veraltet).

Mit dem Update von Apache Kudu auf Version 1.15 müssen Entwicklerinnen und Entwickler künftig auf die kuda-mapreduce-Integration verzichten. Ähnliche Funktionen und Möglichkeiten bieten die Apache Spark-, Apache Hive-, Apache Impala- und Apache NiFi-Integrationen als potenzielle Alternativen.

Kudu 1.15 bringt experimentelle Unterstützung für mehrzeilige Transaktionen. Zum jetzigen Zeitpunkt sind INSERT- und INSERT_IGNORE-Operationen funktionsfähig. Darüber hinaus erlaubt Apache Kudu nun Raft-Konfigurationsänderungen für Kudu-Master und CLI-Tools zur Orchestrierung des Hinzufügens und Entfernens von Mastern in einem Kudu-Cluster. Werkzeuge wie diese sollen den Prozess der Migration zu mehreren Mastern, die Wiederherstellung eines "toten" Masters und das Entfernen von Mastern aus einem Kudu-Cluster deutlich erleichtern. Aus dem Ankündigungsbeitrag geht hervor, dass die Funktionalität weiterentwickelt wird und sich die Schritte zum Hinzufügen, Entfernen und Wiederherstellen künftig noch ändern können.

Zu den neuen Features gehört die Option, Kommentare direkt in Kudu-Tabellen hinzuzufügen. Der Open-Source-Datenspeicher synchronisiert die Kommentare automatisch, sofern die Hive Metastore-Integration aktiviert ist. Tabellenkommentare lassen sich zum Zeitpunkt der Tabellenerstellung hinzufügen und über Tabellenänderungen anpassen.

In Bezug auf die Tabellen gibt es gleich eine weitere Neuerung: Kudu unterstützt jetzt experimentell Größenbeschränkungen pro Tabelle, die auf der Nutzung des führenden Speicherplatzes oder der Anzahl der Zeilen basieren. Bei der Generierung neuer Autorisierungs-Tokens soll der Master nun die Größenlimits berücksichtigen. Darüber hinaus entzieht er den Tokens die INSERT- und UPDATE-Rechte, wenn eines der festgelegten Limits erreicht wird. Um diese Funktion zu aktivieren, müssen Entwickler das Master-Flag --enable_table_write_limit setzen. Die Flags --table_disk_size_limit und --table_row_count_limit lassen sich nach Wunsch anpassen. Es ist zudem möglich via kudu table set_limit die Grenzen pro Tabelle festzulegen. Weitere Informationen zum Release finden sich in den Release Notes.

(mdo)