Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

SIGS DATACOM GmbH

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

Massenverarbeitung in Java, die Fortsetzung

Wenn wir größere Mengen von Daten verarbeiten wollen, werden oft komplexere Systeme herangezogen, wie zum Beispiel Apache Spark mit Databricks, Apache Flink oder Snowflake. Mit effizienter Programmierung und den richtigen Werkzeugen kann das auch in einem lokalen Java-Programm erfolgen.

Für den Einstieg lese gerne vorab den ersten Teil der Kolumne

Verzicht auf Strings und spezielle Hashtable

Die verbleibende String-Erzeugung schlägt immer noch sehr stark zu Buche, die Stadtnamen werden weiterhin als Schlüssel für die Java-Hashmap benötigt. Da führt auch kein Weg vorbei.

Ein Ansatz wäre, stattdessen ein Schlüsselobjekt für die Städte zu verwenden, das nur den Offset und die Länge in das MemorySegment speichert und gegebenenfalls einen Hashcode vorberechnet, um die String-Erzeugung komplett zu vermeiden. Man könnte auch die ersten acht Bytes…

Nächster Artikel
Java und seine Annotationen